2024年4月7日发(作者:)
《大数据时代》读书笔记
Chapter1:引言之大数据
1、 大规模生产、分享和应用数据的时代正在开启(社交网络、电子
商务、移动通信)。数据正成为巨大的经济资产,能够为我们带来全
新的创业方向、商业模式和投资机会。数据发展的障碍在于其流动性
和可获取性,社会各界正尝试公开数据、方式与方法。(这样的做法
有利于数据的共享,使得海量资源在技术支持下得到合适的处理。)
大数据时代的经济学、政治学、社会学和许多其他的科学门类都
发生巨大甚至是本质的变化和发展。
2、 大数据分析的基本要素是庞大的数据资源、处理能力和统计技术。
(像谷歌一样的搜索引擎能够得到足够大量的数据资源,在词条搜索
的热度中找到某种联系并且进行预测。Eg:流感爆发、机票价格预测,
通过大数据分析洞察未知。)
3、 Farecast是大数据公司的一个缩影,海量数据的处理后,帮助我
们应用于商业发展。如今数据已经成为一种商业资本,一项重要的经
济投入,可以创造新的经济利益。当思维改变,新时代里,数据被巧
妙地用来激发新产品和新型服务。(互联网公司作为数据资源的拥有
者,顺利成章的成为新处理技术的领头者。)天文领域、基因领域、
金融领域、保险行业都在演绎着数据量的爆发式增长。人类储存信息
量的增长速度比经济增长速度快四倍,计算机处理能力的增长熟读比
世界经济的增长速度快九倍。
4、 大数据大挑战,我们在分析信息时也产生了三个大转变,这将改
变我们理解和组建社会的方法。
在数据时代我们可以分析更多的数据,有时候甚至可以处理和某
些特别现象相关的所有数据,而不再依赖于随机采样。(使用全体
数据能够更加准确的显示数据背后的结果,让我们更清楚的看到
样本无法揭示的细节信息。)
研究的数据如此之多,以至于我们不在追求精准度。(当我们关注
的范围足够大,在大数据库中我们 往往不会在意精准度。因为全
体数据与采集样本是不同的。)适当忽略微观层面的精确度会让我
们在宏观层面拥有更好的洞察力。
由于前两个转变所致,我们不再热衷于寻求因果关系。追求因果
关系是人们长期以来的习惯,但在大数据时代,很多因果关系难
以寻求,也没有意义寻求,我们转而关注的是相关关系。相关关
系也许不能告诉我们事情为何会发生,但它会提醒我们事情正在
发生。大数据告诉我们“是什么”而不是“为什么”。社会因此放
弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处。
Chapter2:大数据之更多
1、 大数据时代要求不是随机样本,而是全体数据。传统的统计学
目的就是用尽可能少的数据来证实尽可能重大的发现。(这种思
维局限使我们找寻的是如何科学获取样本并分析样本,而忽略
了随着时代的进步,我们的储存分析能力已经足以应付全体数
据,真正应该发展和进步的是究竟该如何处理大时代.)eg:美


发布评论