统计学史的读后感整理(5)
2022-05-29 来源:百合文库
利用测量所获得的点滴数据,从一个局部来推测世界是怎样的,这是科学探究的基本思路和方式。长期以来,我们总是通过这样的方式来认识世界,对其有宗教般的信仰。尽管我们知道,决策者总是先有了想法,才会提出假设。如果决策者自身对所研究的事情存在着偏见,所提出的假设就很难得到实证的支持,这往往会导致探究花费了很长的时间、很大的物力和财力,也常常劳而无功。但科学研究者还是坚定不移地沿着这条道路前行,学校在教学中也将其作为科学研究的基本规范来传授。
在大数据时代,这样的研究方式收到了极大的挑战。先举个事例来说吧。手机辐射是否能够致癌?关于这个问题,无论我们的假设如何,实验的设计都很难进行。首先,样本选择过少,没有统计学上的意义;其次,不能拿人做研究对象;第三,短时间的研究很难观察到变化。有了大数据之后,这样的难题就可以迎刃而解了。前段时间,丹麦就进行了这样的研究。丹麦拥有1985年手机推出以来所有手机用户的数据库。他们从这个数据库中分析了1990年至2007年拥有手机的所用用户的数据,同时,他们还收集了这一期间医院收集的所有癌症患者的数据,然后分析手机用户是否比非手机用户有更高的癌症发病率。这两个数据库本身是完全独立的,在作分析之前从来没有想过可以做这样的研究。结果表明,使用移动用户和癌症风险增加之间不存在任何关系。2011年10月,这一研究的结果发表在《英国医学杂志》上。
上述的案例告诉我们,在获得了大量的数据,能够对事物的整体进行全面的认识之后,假想就没有意义了,我们可以直接根据全面的数据做出结论。
第二,传统的思维习惯受到挑战
因果关系思维,是人们生活中最为普遍的一种思维方式。既是看上去没有关系的事情,人们也总是从因果的角度去理解他。比如说,1885年7月6日,巴斯德接诊了一个被带有狂犬病毒的狗咬伤的孩子,他把自己刚研制出来的狂犬疫苗给孩子注射,结果孩子活下来了。巴斯德的这一举措,使得狂犬疫苗和孩子的生存之间建立起了一个因果关系。但事实上,人被狂犬病狗咬伤后换上狂犬病的概率是只有七分之一,就算没有狂犬疫苗,这个孩子活下来的几率还是有85%。
在大数据时代,这样的研究方式收到了极大的挑战。先举个事例来说吧。手机辐射是否能够致癌?关于这个问题,无论我们的假设如何,实验的设计都很难进行。首先,样本选择过少,没有统计学上的意义;其次,不能拿人做研究对象;第三,短时间的研究很难观察到变化。有了大数据之后,这样的难题就可以迎刃而解了。前段时间,丹麦就进行了这样的研究。丹麦拥有1985年手机推出以来所有手机用户的数据库。他们从这个数据库中分析了1990年至2007年拥有手机的所用用户的数据,同时,他们还收集了这一期间医院收集的所有癌症患者的数据,然后分析手机用户是否比非手机用户有更高的癌症发病率。这两个数据库本身是完全独立的,在作分析之前从来没有想过可以做这样的研究。结果表明,使用移动用户和癌症风险增加之间不存在任何关系。2011年10月,这一研究的结果发表在《英国医学杂志》上。
上述的案例告诉我们,在获得了大量的数据,能够对事物的整体进行全面的认识之后,假想就没有意义了,我们可以直接根据全面的数据做出结论。
第二,传统的思维习惯受到挑战
因果关系思维,是人们生活中最为普遍的一种思维方式。既是看上去没有关系的事情,人们也总是从因果的角度去理解他。比如说,1885年7月6日,巴斯德接诊了一个被带有狂犬病毒的狗咬伤的孩子,他把自己刚研制出来的狂犬疫苗给孩子注射,结果孩子活下来了。巴斯德的这一举措,使得狂犬疫苗和孩子的生存之间建立起了一个因果关系。但事实上,人被狂犬病狗咬伤后换上狂犬病的概率是只有七分之一,就算没有狂犬疫苗,这个孩子活下来的几率还是有85%。