统计学读后感500汇总(8)

2022-08-15 来源:百合文库

整本书来说，我觉得最关键的三个点是前面几个章节：
1、要总体，不要随机样本：从小对于统计学相关的学习，基本都是从样本出发，理论的基础在于如何随机的足够分散的选取样本，这可是技术活加直觉。而对于大数据来说，要的就是总体，本质上来说，总体样本的确更能准确找到结果。但是对于统计来说，总体的分析增加了数据分析的难度，不仅数据核对不好进行，一旦出现数据污染，准确度就会大打折扣，而且进行数据回溯的时候，也无法准确确认问题，而这一点也是后面相关性上问题；
2、要混乱，而不是精确：这里主要想说明的是希望数据的多样性，尽量将相关数据都收集起来，不管是结构化的还是非结构化的。这样就不可避免的最终结果的不准确性。大数据更多的是从一个总体数据中说明以后概率事件，既然是概率，也就可以理解无法精确。这里有个点的说明，我觉得需要提一下，大数据算法更倾向于“简单”，而不是复杂，这个倒是出乎我的意外。
3、要相关性，而不是因果：从我对于知识获取的过程来说，我是不同意这个观点，从人体对于知识的理解，还是要从因果论出发，没有因果论，就会变成瞎子。而作者的观点上来说，原因可能还是从大数据本身的非准确性，一旦找到合适的算法，找到相关性，向上追述原因本身就很难。但是从举的示例上看，相关性的确认是一个非常大的工程，基本就是使用排举法，一个一个试。
所以，对于大数据来说，最重要的三点是：
1、数据——得到更多数据；
2、算法——建立更快的算法体系；
3、思维——寻找数据间更多的相关性。
对于数据最终的走向，我同意书中所提到的政府管理的观点，既然都是以“石油”的标准来看待数据，政府统一管理也就是必然的了。而且对于政府来说，掌握更多数据也有利于其管理及维护社会的稳定性。而对于社会道德方面的论述，我不想多说什么，时代发展是不会被道德绑架的。
所以最后，想要建立对于大数据的思维，《大数据时代》还是值得一读，里面的很多示例也非常不错。如人际关系这一块，也是出乎我的意料。

仙女棒带一整天的感受上学

当各个学科拟人化后的样子

当校霸被学霸掰弯以后顾琛

1 ...6 7 8 9 10 ...21 查看全文