《与大数据同行》读后感摘录(20)
2022-08-24 来源:百合文库
数学之美读后感 篇5
第8章里的“索引”,作者讲到谷歌面试产品经理的一道题目:如何向你的奶奶解释搜索引擎。关于这个问题,好的回答据说是用图书馆的索引卡片做类比。
我奶奶是个文盲,一生为农,日出而作,日落而息。她很少看电视,更别说图书馆。所以用图书馆的例子,对我们来说,很生动;对她来说,很生涩。
我们村的田地是按照地形、土质和流水等来划分的,计有一等地、二等地和三等地。一般情况下,一等地用来种水稻,二等地用来种菜,三等地用来种水果。
所以当我奶奶想要给我摘桔子的时候,她肯定不会从一等地或者二等地一块地一块地找过来,而是直接跑到三等地(一般就是山上)。
像这样的索引,是基于脑子里的“数据库”,因为田地不会很多,多了也来不及种,所以跟布尔代数没什么关系。但是这样解释,我奶奶就会大概明白了。我奶奶生前一次电脑也没用过,跟她解释这些,唯一的意义是,她会觉得我没有敷衍她,这会使她欣慰——如果有机会解释的话。
杨小凯曾经说,如果张五常多加注重使用数学模型,那诺奖也许就拿下了。张五常对此不以为然,反以为傲,自诩当今世上只有科斯、阿尔钦和他才敢只用文字,不借助数学模型就在经济学界占有一席之地。
当然,张五常也不是彻底否定数学的作用,他认为能够用文字解释的经济学原理,不必使用数学对其复杂化。
数学在信息学和经济学里都有广泛应用,但是在信息科学方面,对数学作用大小的争论就没有经济学那么大了。
我们常说搜索引擎的竞价广告,就可能经历到第三方公司,通常他们宣传自己是谷歌或者别的搜索引擎公司的代理商,然后通过不正当手段为客户提高网页的排名。谷歌在消除网络作弊方面做了很多努力,通过修改排序算法来为搜索者提供更加准确实效的信息。
“作弊的本质是在网页排名信号中加入噪音,因此反作弊的关键是去噪音。沿着这个思路可以从根本上提高搜索算法抗作弊的能力。”我们公司就是吃了这个亏,交了不少钱给第三方公司,结果算法一变,关键词的排名从前三下降到前三页没影。
第8章里的“索引”,作者讲到谷歌面试产品经理的一道题目:如何向你的奶奶解释搜索引擎。关于这个问题,好的回答据说是用图书馆的索引卡片做类比。
我奶奶是个文盲,一生为农,日出而作,日落而息。她很少看电视,更别说图书馆。所以用图书馆的例子,对我们来说,很生动;对她来说,很生涩。
我们村的田地是按照地形、土质和流水等来划分的,计有一等地、二等地和三等地。一般情况下,一等地用来种水稻,二等地用来种菜,三等地用来种水果。
所以当我奶奶想要给我摘桔子的时候,她肯定不会从一等地或者二等地一块地一块地找过来,而是直接跑到三等地(一般就是山上)。
像这样的索引,是基于脑子里的“数据库”,因为田地不会很多,多了也来不及种,所以跟布尔代数没什么关系。但是这样解释,我奶奶就会大概明白了。我奶奶生前一次电脑也没用过,跟她解释这些,唯一的意义是,她会觉得我没有敷衍她,这会使她欣慰——如果有机会解释的话。
杨小凯曾经说,如果张五常多加注重使用数学模型,那诺奖也许就拿下了。张五常对此不以为然,反以为傲,自诩当今世上只有科斯、阿尔钦和他才敢只用文字,不借助数学模型就在经济学界占有一席之地。
当然,张五常也不是彻底否定数学的作用,他认为能够用文字解释的经济学原理,不必使用数学对其复杂化。
数学在信息学和经济学里都有广泛应用,但是在信息科学方面,对数学作用大小的争论就没有经济学那么大了。
我们常说搜索引擎的竞价广告,就可能经历到第三方公司,通常他们宣传自己是谷歌或者别的搜索引擎公司的代理商,然后通过不正当手段为客户提高网页的排名。谷歌在消除网络作弊方面做了很多努力,通过修改排序算法来为搜索者提供更加准确实效的信息。
“作弊的本质是在网页排名信号中加入噪音,因此反作弊的关键是去噪音。沿着这个思路可以从根本上提高搜索算法抗作弊的能力。”我们公司就是吃了这个亏,交了不少钱给第三方公司,结果算法一变,关键词的排名从前三下降到前三页没影。