2024年4月7日发(作者:)

《大数据时代》读书笔记

Chapter1:引言之大数据

1、 大规模生产、分享和应用数据的时代正在开启(社交网络、电子

商务、移动通信)。数据正成为巨大的经济资产,能够为我们带来全

新的创业方向、商业模式和投资机会。数据发展的障碍在于其流动性

和可获取性,社会各界正尝试公开数据、方式与方法。(这样的做法

有利于数据的共享,使得海量资源在技术支持下得到合适的处理。)

大数据时代的经济学、政治学、社会学和许多其他的科学门类都

发生巨大甚至是本质的变化和发展。

2、 大数据分析的基本要素是庞大的数据资源、处理能力和统计技术。

(像谷歌一样的搜索引擎能够得到足够大量的数据资源,在词条搜索

的热度中找到某种联系并且进行预测。Eg:流感爆发、机票价格预测,

通过大数据分析洞察未知。)

3、 Farecast是大数据公司的一个缩影,海量数据的处理后,帮助我

们应用于商业发展。如今数据已经成为一种商业资本,一项重要的经

济投入,可以创造新的经济利益。当思维改变,新时代里,数据被巧

妙地用来激发新产品和新型服务。(互联网公司作为数据资源的拥有

者,顺利成章的成为新处理技术的领头者。)天文领域、基因领域、

金融领域、保险行业都在演绎着数据量的爆发式增长。人类储存信息

量的增长速度比经济增长速度快四倍,计算机处理能力的增长熟读比

世界经济的增长速度快九倍。

4、 大数据大挑战,我们在分析信息时也产生了三个大转变,这将改

变我们理解和组建社会的方法。

 在数据时代我们可以分析更多的数据,有时候甚至可以处理和某

些特别现象相关的所有数据,而不再依赖于随机采样。(使用全体

数据能够更加准确的显示数据背后的结果,让我们更清楚的看到

样本无法揭示的细节信息。)

 研究的数据如此之多,以至于我们不在追求精准度。(当我们关注

的范围足够大,在大数据库中我们 往往不会在意精准度。因为全

体数据与采集样本是不同的。)适当忽略微观层面的精确度会让我

们在宏观层面拥有更好的洞察力。

 由于前两个转变所致,我们不再热衷于寻求因果关系。追求因果

关系是人们长期以来的习惯,但在大数据时代,很多因果关系难

以寻求,也没有意义寻求,我们转而关注的是相关关系。相关关

系也许不能告诉我们事情为何会发生,但它会提醒我们事情正在

发生。大数据告诉我们“是什么”而不是“为什么”。社会因此放

弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处。

Chapter2:大数据之更多

1、 大数据时代要求不是随机样本,而是全体数据。传统的统计学

目的就是用尽可能少的数据来证实尽可能重大的发现。(这种思

维局限使我们找寻的是如何科学获取样本并分析样本,而忽略

了随着时代的进步,我们的储存分析能力已经足以应付全体数

据,真正应该发展和进步的是究竟该如何处理大时代.)eg:美