硅基人与地球人的渊源开始了(3)
2023-11-28 来源:百合文库
他们把这种机制称为反向传播。
当然,想适配通用函数,神经网络必须具有足够的容量,即网络要有足够的深度,满足一定的神经元数量是必然条件;其次,与阈值函数不同的是,使用梯度的其他激活函数作为感知机,可以在浅层网络丢失部分信息的时候,在深层网络获得一定的信息补偿。因此,神经网络对通用函数的拟合,一定是深度、宽度和激活函数之间的权衡,而适配通用函数的本质其实是硅基人把非线性激活函数融入到了整个结构中。
很快,硅基人找到了影响地球文明发展的突破口。因为地球上不同文明之间的语言存在某种模式上的互通性,主要是指不同地区的文明其语言所指有着共同的物理基础,但是语言组织的模式、表达的具体含义及信息强度等各有不同。于是想利用不同语言之间的翻译验证他们设计的神经网络结构的合理性。这个神经网络的基础是硅基人擅长的概率论、数理统计以及矩阵运算。
但是缺点就是硅基人也无法解释每个维度的特征具体代表什么含义,因为能够让这样一个拟合函数真正起作用需要经过多次的实验和参数调整,有很大的经验成分和试错成分在里面。这些在地球东方文明的语言体系下得到了印证,因为他们试图利用设计的神经网络对语言进行建模,把该语言的所有内容编码为一个高维数值空间,以彻底掌握该语言。但是显然他们基于地球语言都是线性的(一句话或者一段话乃至更长的语篇可以看成字词串)而简单对共现词进行建模的方式是存在巨大缺陷的。他们的处理方式本质上比较简单,即语言中挨得近的字或者词语具有近似的含义,对应地会被编码到高维空间中相近的位置。
关于这一点,实际上硅基人做了多次尝试:
【1】第一次尝试:针对一种语言(针对当时地球上使用人数最多的语言——汉语),最基本的数值化映射方法是将每个字或者词映射为一个字典序号。也就是说,假如汉语的所有词汇构成一个词汇表(包括单个字的词、多个字的词),词表长度为5000,其中一个词为“吾”,序号为3;另一个词为“壮观”,序号为347,... ...以此类推,这样倒是可以把地球语言的这些符号表示为数字,但是因为数字是离散的(就是不连续,因为字典序是自然数,比如1和2之间还有1.1、1.111、1.2等等无穷多个数),在硅基人的微积分体系下无法很好地计算;另外字典序号也没有任何的实际意义,仅仅是从无法计算的符号映射到了可以勉强计算的数字符号。
当然,想适配通用函数,神经网络必须具有足够的容量,即网络要有足够的深度,满足一定的神经元数量是必然条件;其次,与阈值函数不同的是,使用梯度的其他激活函数作为感知机,可以在浅层网络丢失部分信息的时候,在深层网络获得一定的信息补偿。因此,神经网络对通用函数的拟合,一定是深度、宽度和激活函数之间的权衡,而适配通用函数的本质其实是硅基人把非线性激活函数融入到了整个结构中。
很快,硅基人找到了影响地球文明发展的突破口。因为地球上不同文明之间的语言存在某种模式上的互通性,主要是指不同地区的文明其语言所指有着共同的物理基础,但是语言组织的模式、表达的具体含义及信息强度等各有不同。于是想利用不同语言之间的翻译验证他们设计的神经网络结构的合理性。这个神经网络的基础是硅基人擅长的概率论、数理统计以及矩阵运算。
但是缺点就是硅基人也无法解释每个维度的特征具体代表什么含义,因为能够让这样一个拟合函数真正起作用需要经过多次的实验和参数调整,有很大的经验成分和试错成分在里面。这些在地球东方文明的语言体系下得到了印证,因为他们试图利用设计的神经网络对语言进行建模,把该语言的所有内容编码为一个高维数值空间,以彻底掌握该语言。但是显然他们基于地球语言都是线性的(一句话或者一段话乃至更长的语篇可以看成字词串)而简单对共现词进行建模的方式是存在巨大缺陷的。他们的处理方式本质上比较简单,即语言中挨得近的字或者词语具有近似的含义,对应地会被编码到高维空间中相近的位置。
关于这一点,实际上硅基人做了多次尝试:
【1】第一次尝试:针对一种语言(针对当时地球上使用人数最多的语言——汉语),最基本的数值化映射方法是将每个字或者词映射为一个字典序号。也就是说,假如汉语的所有词汇构成一个词汇表(包括单个字的词、多个字的词),词表长度为5000,其中一个词为“吾”,序号为3;另一个词为“壮观”,序号为347,... ...以此类推,这样倒是可以把地球语言的这些符号表示为数字,但是因为数字是离散的(就是不连续,因为字典序是自然数,比如1和2之间还有1.1、1.111、1.2等等无穷多个数),在硅基人的微积分体系下无法很好地计算;另外字典序号也没有任何的实际意义,仅仅是从无法计算的符号映射到了可以勉强计算的数字符号。