《与大数据同行》读后感摘录(18)
2022-08-24 来源:百合文库
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现……感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的……)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;
又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。
又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。