数学之美陈省生观后感摘录(4)
2022-05-25 来源:百合文库
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50—70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50—70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。