2024年4月7日发(作者:)
《数学之美》读后感
读完某一作品后,想必你一定有很多值得分享的心得,此时需要
认真思考读后感如何写了哦。那么你会写读后感吗?下面是小编为大
家整理的《数学之美》读后感范文,希望能够帮助到大家。
《数学之美》读后感 篇1
我是在读了吴军博士的《浪潮之巅》之后,发现推荐了《数学之
美》这本书。我到豆瓣读书上看了看评价,就果断在当当上下单买了
一本研读。本来我以为这是一本充满各种数学专业术语的书,读后让
我非常震撼的是吴军博士居然能用非常通俗的语言将自然语言处理等
高深理论解释的相当简单。
在李开复博士之后,吴军博士又成为了目前备受瞩目的具有深厚
技术背景的作家。对于我来说,读这本书有扫盲的功效,让我知道了
很多以前不知道的东西。我的想法是在研究生阶段,不只局限于导师
的研究方向,通过更加广泛的涉猎知识,去寻找一个自己喜欢的研究
领域。如果找到了这样一个领域,那么我就读博士。如果没有的话,
那么我想还是工作算了。
1、学科之间的联系是如此的重要。
全书主要是围绕着吴军博士所研究的自然语言处理方向来讲述一
些应用在这个研究领域的数学知识,用了很大篇幅讲解了将通信的原
理应用到自然语言处理上所取得的巨大成功。以前学习计算机网络的
时候,学过一个香农定理。对香农的认识就从香农定理开始,因为考
研会考相关的计算题。看了这本书才知道,香农的《信息论》对今天
的影响真的是不可估量。通过这样一个过程,我也对以前的本科学校
的学科建设产生了一些忧虑。
对于培养计算机人才来说,无论是培养应用型人才,还是培养研
究型人才,都应该与电子、通信有一定的交叉,这样对学生思考问题
的启发与视野的开阔有着重要的作用。计算机本身就是从电子、通信、
数学等学科中抽出来的新兴的学科,在发展了多年之后,我们发现它
仍然需要继承一些传统。回想自己的本科四年,上的更多的课时语言
类、技术类的课程,这些课程的确对提升学生的就业有很大帮助。但
是我想说的是,一个忽视数学基础、学科交叉的学校,他无法成为一
所国内的一流大学。作为一个母校培养的学生,我深知改革的阻力与
困难,但是我希望母校的计算机学院能越办越好。我们现在已经培养
出很多高薪优秀的技术人才,我希望将来也能培养出更多的研究型人
才。
2、看起来很牛的东西却用着难以置信的简单数学原理。
在整本书中让我最为印象深刻的是解释Google搜索的原理,居然
就是简单的布尔代数运算。这个的确让我大跌眼镜,我一直认为搜索
时一个非常复杂而庞大的问题,其数学原理也是相当高深的,但是吴
军博士的解释让我大开眼界。与此同时也知道了Google为什么牛,
牛在哪了。搜索的原理虽然非常简单,但是搜索是一个需要对海量数
据进行操作的工作。Google在海量数据的处理方面的确是相当先进的,
MapReduce、BigTable等等一些技术的发明与应用使得Google在搜
索上无出其右。目前分布式存储、分布式计算、数据仓库与存储等研
究领域近些年来的大热也说明Google在引领研究方向上的超凡本领。
3、感谢概率老师的教诲。
在大二的时候,有一个在我们学生中声望很高的概率老师,他在
课程即将结束的时候跟我们说我们将的是前几章,这些事概率论与数
理统计的基础。对于你们计算机的学生来时,后面的章节才是最有用
的,以后一定要好好的研究,弄上一两个在你的毕业设计上就会让你
毕业设计提升一个档次,有可能验收你毕业设计的老师也不懂。我当
时对他的话没有特别在意,我只关心期末考试要考哪些题目,因为我
那个学期的概率课基本上都在睡觉,只有他讲笑话的时候不睡。
我看《数学之美》后发现马尔科夫链、贝叶斯网络之后,对以前
的概率老师充满无限的敬意。我发现我们再本科阶段学习的《高等数
学》、《线性代数》、《概率论与数理统计》在计算机学科应用较多
的要数概率论与数理统计,还有一门我学的不好的《离散数学》在计
算机中也是有着举足轻重的地位。
我在看米歇尔的《机器学习》时也发现很多熟悉的概率论与数理
统计的知识,这让我不得不开始考虑重新弥补自己的数学短板。我的
想法是在研一这一年把概率论与数理统计、线性代数、离散数学尽我
最大的努力补一补,希望他们对我今后的学习有所帮助。
4、说说作者吴军博士。
吴军博士写的书对于学习计算机的学生来说,读起来有种说不出
的亲切感。可能这跟他是技术出身的原因有关,流畅的文笔、质朴的
文风也让人读起来很舒服。看高晓松在优酷上的《晓说》就知道,在
硅谷有着众多的华裔工程师,他们很多都来自清华、北大等国内的名
牌大学,这些人在美国实现着自己的梦想。吴军博士也曾是这其中的
一员,我非常希望那些像吴军博士一样的牛人们能够写书或者来国内
的大学做一些演讲、论坛等等,开阔一下我们的视野,传授一下做学
问的经验。
与此同时,我也在想为什么我们国家那么多优秀的IT人才都去了
美国。这个问题在我去苹果公司在东软信息学院组织的培训过程中得
到了答案,那个南京邮电的老师讲了讲中国为什么不像美国那么有创
造力。我们中国人并不缺乏创造力,很多时候是我们所处的外部环境
恰恰阻碍了创新。我想那么多优秀的清华北大学子纷纷到大洋彼岸的
美国,正是被美国开放的学术环境、创新氛围所吸引,每个人都有自
己的梦想,他们去美国也是为了能实现自己的梦想。以前都觉得他们
是不爱国,现在长大了,对于这个问题看得更清楚了一点。
我想说我们的祖国在经历了改革开放30多年的飞速发展之后,目
前正处于一个关键和脆弱的时期。我们靠着人口红利取得了巨大的成
就,我们能不能凭借人才红利取得更大的成就还是未知。希望有更多
的人才能像李开复博士、吴军博士那样,为我们这个民族青年的成长
和国家发展做出贡献。
《数学之美》读后感 篇2
看完《浪潮之巅》,了解了硅谷很多公司尤其是互联网公司的沉浮,
对吴军的书就非常感兴趣,看到吴军的另一本书《数学之美》,激起
了很深的兴趣,所以很快把书看完了,普及了很多基础的知识的同时
也启发了很多想法,感觉很爽。
我自己在交大学的是工科,小学、初中、高中都是一路参加数学
竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己
对数学有很深的感情,同时女朋友大学也是数学系,有点后悔的大学
选了个并不感兴趣的专业(交大当时允许我随便选专业,我没有跟父
母商量自己选了船舶制造)。
看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到
的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的
重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差
不多了,书中提到的很多定理还很有亲切感
书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在
google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部
分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax
说得对,也许是出版社为了卖书取得名字。
不得不说吴军是一个大家,文字中能够透露出大家的气势,书中
不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚
至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人。
书中具体的模型就不介绍了,说几点我学到的知识,能列出来的
都是看完还有点印象的:
1、在互联网的世界中,信息是如何量化的,信息熵是怎么回事?
有啥用?
2、搜索领域中,语言是如何统计的,尤其是如何通过概率模型进
行分词。
3、搜索引擎是如何工作的—网络爬虫是怎么回事儿。
4、PageRank是怎么回事?为了解决什么问题?
5、密码与解密领域的数学模型,尤其提到的二战时候的各种解密
的趣事儿,提到的电视剧《暗算》打算抽空看下
6、拼音输入法的数学模型。
7、文本自动分类的模型。
看完之后最大的感受就是:
1、数学模型巨大作用,推动着新技术的发展。
2、攻城师是一个伟大的职业,能够运用这些知识转化为生产力,
非常牛叉。
3、书中提到了很多数学模型都是在不断的进化、改良、升级,也
就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,
跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点
上的持续优化就没有意义了。
但同时技术很大的作用是用来解决实际问题的,书中提到的各个
数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕竟
公司不是科学研究所,所以追求通过技术直接解决用户需求或者做成
易用的工具给业务人员、运营人员来间接解决用户需求是挺重要的,
可能不是技术人员觉得做到80分就可以了,而是用户、使用工具的人
觉得做到80分是一个重要的衡量。
提到“工具”,想到赵赵说过的一句话:“不好用就等于没有”,
可能就是这个点,同时运用工具的人必须好好的运用,如果用不好甚
至不用就太对不起技术了。
《数学之美》读后感 篇3
上个月去北京开会,顺道拜访了人民邮电出版社,合作多年的编
辑陈冀康赠我一本《数学之美》,说一定是我喜欢看的类型。以前也
在网上零散看过Google黑板报上吴军先生的文章,对他的前一本书
《浪潮之颠》也有耳闻,但没有读过。这次有机会集中阅读他的文章,
确实是一段美妙的体验。
读完这本书有一点强烈的感受:工具一定要先进。数学是强大的
工具,计算机也是。这两种工具结合在一起,造就了强大的google、
百度、亚马逊、阿里、京东、腾迅等公司。他们不是百年老店,但他
们掌握了先进的工具。
掌握了先进的工具,必将获得竞争优势。如果你知道哪里有一群
软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使用
他们提供的服务,因为这会给你带来优势。所以我们使用Google的
搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ和微博联系朋友,
使用银行卡和网上银行,利用交易终端在全球市场上进行各种交易。
人类历史就是一部工具的进化史。石器、青铜、铁器、火药、蒸
汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具的
进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联网视
频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸质书那
样。
但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花
费许多时间。毛笔就是这样一个例子。今天学习掌握毛笔这种“落后
的”工具,还有什么意义?其实我们在使用一些“落后的”工具时,
主要是在学习工具背后的思想。
书法和绘画中蕴含的艺术审美的一般原则,经得起具体工具变迁
的考验。甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值
得现代人学习。思想工具是比实物工具更强大的工具。
工具组合使用,形成更强大的新工具。《数学之美》中提到的马
尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。
这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是中
学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机
新闻分类这样的难题!
每一种工具的背后,是人们对世界的一种理解。蒸汽机和内燃机
背后,是力学的世界。电报、电话、电视、计算机和互联网背后,是
信息的世界。数学是抽象的工具,是其他工具背后的工具。每一门学
科要成为科学,都少不了数学。也许有一天人们会习惯,用数学工具
来分析艺术。数学是一种语言,它源于具体的世界,又高于具体的世
界。如果说语言是对世界的认识和描述,如果说数学是一种语言,那
么它一定是最接近神的语言。看似毫不相关,却又能描述万事万物。
学习数学有什么用?物理学家费曼当年在大一时提出这个问题,
他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有扎
实数学功底的人才正进入各行各业,例如金融业。我认识一个出版社
的老总,他招应届毕业生有一个条件:数学要好。
工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件
算法工程师加上计算机集群,这是目前一流企业必需的.装备。正如马
克.安德森所说的,各行各业的一流公司,都是软件公司。优秀的软件
算法工程师,是人才争夺的焦点。这样,我们就容易理解Google招
工程师的要求。
对信息加工处理和传递的能力不断增强,是知识经济的特点。
《数学之美》展示了Google如何运用数学和计算机网络,带领我们
进入云计算和大数据时代。
知识经济时代的工作,就是在各自的领域中进行科学研究。科学
研究要大胆假设,小心求证。科学研究要量化。科学研究要有对比实
验。科学研究要有数学模型。科学研究要有田野调查。科学研究要有
文献查证。科学研究要有同行评议。《数学之美》向我们介绍了自然
语言分析领域的科研方法和过程。
任何一个领域,深入进去都有无数的细节。有兴趣的人不但没被
这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。
吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达到
的高度。值得我学习。
感谢吴军先生分享他的知识和深刻见解,也感谢人民邮电出版社
出了这样一本好书。
《数学之美》读后感 篇4
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令
我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机
行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的
模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,
神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻
分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在
图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一
些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但最好
别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5
月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类
图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前
的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借
了一本来,一直到今天晚上把它给看完了。
因此想写一点东西来总结、反思一下,反正刚开完班会也没什么
事干。写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,
网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面
向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造
诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、
计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没
关系……),所以尤其适合信科的人看。内容大部分是和人工智能、计
算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原
理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这
些文章都是发表在Google黑板报上的,后来经过了重写,所以网上
下载的和书本内容有所差异。
由于吴军本人是研究自然语言处理和语音识别的,所以统计语言
模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的
展现……感觉收获还是挺多的,知识上的有一些,但更多还是思维方式
上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,
基本原理其实是出乎意料简单的。
比如高准确率的机器翻译,看上去好像是计算机能够理解各国语
言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计
模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集
中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真
正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,
作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,
许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实
际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简
单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实
现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地
方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一
些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成
长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中
国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松
的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺
乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开
发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,
也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教
科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后
的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实
并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可
以“四两拨千斤”,改变亿万人的生活。
《数学之美》读后感 篇5
在网上看到有人推荐吴军博士的《数学之美》,尽管我从事社会
科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验
正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世
界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,
一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;
整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这
样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,
所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。
语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但
问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然
只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只
能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最
快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶
尖专家,如李开复,吴军博士是卓越的科学家之一。
至此我才感到,在计算机主导的世界中,信息化就是数字化,而
最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字
化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与
人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。
但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本
没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成
数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工
作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套
用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的
本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方
式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类
为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,
但最终以失败告终(20世纪50-70年代),70年代后科学家采用了
语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次
证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人
类数千年文明进化出来的语言系统,就是动态的随机概率事件。
其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百
分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,
利用概率统计是不二法门。
其三,语言本质上就是信息传播,只有从通信模型视角才能真正
理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强
项,计算机是永远不可能理解语言的意思的。
在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、
掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们
的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克
对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一
样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是
无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟
是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流
的科学和技术。
观国内的学说界,官风盛行、人情充斥,与这些一流学说群对科
学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚
远。
看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,
能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。
《数学之美》读后感 篇6
本书介绍了Google产品中涉及的自然语言处理、统计语言模型、
中文分词、信息度量、拼音输入法、搜索引擎、网页排名、密码学等
内容背后的数学原理。让我们看到了布尔代数、离散数学、统计学、
矩阵计算、马尔科夫链等似曾相识的内容在实际生活中的应用。相比
于其他数学题材书籍,吴军老师把抽象、深奥的数学方法解释得通俗
易懂,书中同时引用了诸多的历史典故和人物介绍,给人以很多启发,
也让人由衷感叹数学的简洁和强大。
虽是数据专业毕业,但是才疏学浅,无力对数学的美进行阐述。
仅就书中两个比较喜欢的地方发表一点不成熟的见解,与诸位共勉。
其一,在讲Google的搜素引擎反作弊时谈到做事情的两种境界
“道”和“术”,术就是具体的做事方法,而道则是隐藏在问题背后
的动机和本质。在术这个层面解决问题要付出更多的努力,有点类似
于我们常说的“头疼医头,脚疼医脚”,暂时不疼了,过几天复发了,
再去医治,如此往复,无法从根本上解决;而只有找到了致病原因,
才能做到药到病除,根本治愈。本人之前参与过行内月终自动核对的
研发,月终核对初期数据的不一致性只能靠数百业务人员人工核对数
据差异,然后修改数据,每月1日都要加班加点,工作量很大,这是
从术上解决问题。后来找到了产生差异的原因是会计核算时的利息调
整造成的,把这些数据接过来进行相应冲减后差异就消失了,业务人
员也不用来加班了,这才是从道上解决问题。
其二,是在做中文网页排名时提到的从业界成功的秘诀之一:
“先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题。许多
时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始
追求大而全的解决方案,之后长时间不能完成,最后不了了之”。我
们在做项目时也是一样,业务有时要的功能非常急,可能有些功能也
实现不了(比如系统响应时间长、查询明细不能支持省行等)。这时
我们就要将焦点关注在那些可以实现的80%的功能上,哪怕刚刚上线
的系统界面丑点,操作复杂点,反应速度慢点,但是至少业务有可用
的系统,剩下时间再去优化那剩下的20%。这样可以帮助我行抢占先
机,在与同行业的竞争中取得主动。如果等待我们把所有的细节都搞
清楚再动手开发,力求完美,那么很可能系统能够上线的时候业务已
经不需要了。
数学之美,也就是简单之美。希望大家能够喜欢数学,喜欢数学
之美。
《数学之美》读后感 篇7
吴军2012年的作品,源于其在谷歌黑板报的系列文章,讲述数学
方法在信息技术中的应用,说明了为什么科学研究中方法论如此的重
要,以及数学如何简单优雅地解决问题,直达本质。对比他的其他作
品比如《浪潮之巅》、《硅谷之谜》,本书比较偏技术,属于目前大
热的数据科学(Data Science)范畴,在云计算、大数据和人工智能等成
为常态和趋势的今天,适合所有对IT技术及相关管理人员阅读。对我
而言,最大的收获包括:
规则vs.算法:自然语言处理,在早期几十年基于文法规则都无法
达到可应用的效果,终于在转变为基于统计方法且积累了足够数据后,
形成了突破,达到了今日可大规模商用的效果。再次说明了数据及算
法在今日的重要性。
一些常见应用涉及的优化算法:搜索相关(分词、网络爬虫、索引、
结果排名、广告及反作弊)、文本处理(新闻分类、广告相关性、输
入法)、地图路线规划、信息指纹、密码学等。这些算法不止适用于
这些应用场景,还可以在其他许多地方借鉴,比如用户评论分析也需
要用分词和语义分析,许多价值优化算法都需要用到期望值最大化和
逻辑回归等。
优雅的理论模型:在初始阶段,出于时间和成本考虑,在技术实
现上可能会使用一些拼凑的方法,甚至山寨,但是这种方法并不可持
续,很难进行系统化的优化,开发维护成本都很高,最终会遇到灾难
性问题。做事情需要有境界,最求简单而优雅的理论和工程实现,这
在长期是非常有好处的。
吴军使用浅显易懂的语言,把解决问题的思路和复杂的数学模型
讲得很清楚,虽然理解延伸阅读里的具体数学公式还是有些挑战。其
实重要的是思想和方法,具体的实现可以在用到时再进一步的了解。
如何用简单的语言把复杂的技术讲清楚,也是我工作的需要,要不断
学习磨练。书里提到了启发吴军这方面能力的两本书,即《从0到无
穷大》和《时间简史》,会有要去看下。
《数学之美》读后感 篇8
人们发现真理的形式上从来都是简单的,而不是复杂和含混的。
——牛顿
自小就学数学的我,并不觉得它是美好的。于我而言,数学就像
紧箍咒一样,不能提,一提。就头疼。
而看了吴军博士所写的《数学之美》后,我对数学的感觉,从以
前的被动获取和勉强学习,变成了强烈热爱和主动积极的学习。这原
因就在于我发现了它的价值,它的一枝独秀,不可或缺的地位,数学
的博大精深和对其相关的各类事业的发展的价值已使我深深陶醉其中。
这本书中有很多复杂且长的公式,但这并不妨碍大众的阅读,因为它
并非在于让你了解更多IT领域的知识,而是用了大量篇幅介绍各个领
域的典故,让我们感受数学思维。这就像李欣教授所说:“成为一个
领域的大师有其偶然性,但更有其必然性。其必然性就是大师们的思
维方法。”
英国哲学家弗朗西斯·培根在《论美德》这篇文章中讲:“美德就
如同华贵的宝石,在朴素的衬托下最显华丽。”数学的美妙,也恰恰
在于一个好的思维,好的方法。
在《数学之美》十四章,我被它的标题吸引到了。“余弦定理和
新闻的分类”,这俩看似八竿子打不着。却有着紧密的联系。可以说,
新闻的分类很大程度上依赖的是余弦定理。我们都知道,计算机处理
一个问题是让他去算,而不是像人类一样理解了它,再去解决。而科
学家们遇到这个问题,却用了另一种思维,他们把文字的新闻变成一
组可计算的数字,然后再设计一个算法来算出任意两篇新闻的相似性。
稍详细一些就是:对于一篇新闻中的所有实词。计算出它们的TF-IDF
值,再把这些值按照其在对应词汇表的位置依次排列就得到一个向量,
这即新闻的特征向量。这时,就可以通过计算两个向量夹角来判断对
应的新闻主题的接近程度,这也就要用到余弦定理了。我在必修五数
学书上学到余弦定理时,很难想象它可以用来对新闻进行分类。在这
里我又一次看到了数学工具的用途。
在书中,我也了解到了数学的发展实际上是不断的抽象和概括的
过程。这些抽象了的方法看似离生活越来越远,但他们最终能找到应
用的地方,布尔代数便是如此。
布尔代数的简单不能再简单了。运算的元素只有两个0和1,基本
的运算只有“与”、“或”和“非”。几乎就是我们现在所学的“判
断命题真假”。在布尔代数提出后的80多年里,他确实没有什么像样
的应用。直到1938年香农在他的硕士论文中指出,布尔代数来实现开
关电路。才使得布尔代数成为数字电路的基础。正是依靠这一点,人
类用一个个开关电路最终“搭出”电子计算机。
这些,都能体现作者“简单即是美”的思想。他在书中也写道:
“数学的精彩之处就在于简单的模型可以干大事。”这些,也都是我
从未感受到过的。并且,在这本书中,作者也用了不少篇幅来介绍通
信领域的世界级专家,让我对真正的世界级学者有更多的了解和理解,
比如贾里尼克,Google AK-47的设计者——阿米特·辛格博士,自然
语言处理的教父米奇·马库斯等等。
爱因斯坦说过:“从希腊哲学到现代物理学的整个科学史中。不
断有人力图地表面上极为复杂的自然现象归结为几个简单的基本概念
和关系,这就是整个自然哲学的基本原理。”这本书把数学在IT领域
的美丽予以了精彩表达,我也知道,把一件复杂的事用简单的语言表
达出来,并非易事,这应该也是各界人士都对这本书予以好评的原因
吧。
当然,我也明白,欣赏美不是终极目的,更值得我们追求的是创
造美境界。
还有,希望未来的自己,无论生活好与坏,都能少一点浮躁,多
一点踏实和对自然科学本质的好奇求知。
《数学之美》读后感 篇9
这本书一共3章,主要介绍了这些数学方法:统计方法、统计语
言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页
排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密
码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、
句法分析、维特比算法、各个击破算法等。从第一章开始其明了幽默
的语言就深深的吸引了我,让我觉得如果早一点看这本书,也许数学
之于我就是另一番天地。
第一章里作者从原始人类的通信方式开始入手,人类最早利用声
音进行的通信依赖于开篇给出的"编码-传输-解码"的基本原理,指出原
始人的通信方式和今天的通信方式没什么不同,这世界上近现代最普
遍的原理大部分都在人类发展的历史上被无意识的使用着。
第六章信息论给出了信息的度量,它是基于概率的,概率越小,
其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确
定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物
理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概
念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存
在联系的,要学会借鉴其他知识。
这本书里也能找到不少在学的课程知识,如大学专业课里,数电
总是要比模电简单不少,而自然界里大部分的信号都属于模拟信号。
所谓模拟信号,是指从时间和数值两种维度上看来都是连续变化的信
号。在实际电路中,模数转换是一个很重要的过程,将预处理的模拟
信号经过模数变换为数字信号,然后进行数字信号处理。而数字化处
理有很多优点,比如功能强大、抗干扰能力强、易于传输等。
简而言之,如果没有数学,就没有数字信号处理和传输的概念,
而数字信号传输在当下大规模的集成电路里是必不可少的,这是通信
成功的基本要求。
作者把生活中遇到的复杂的问题,以简单清晰,直观的模型或者
公式展现出来。我们可能过于注意生活中的种种奇妙现象,往往忽略
了追求其理论逻辑的演绎,而这,也是大部分问题的主要根源。
罗素曾经说过:"数学,如果正确地看,不但拥有真理,而且也具
有至高的美";爱因斯坦也曾说过:"纯数学使我们能够发现概念和联系
这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。"数
学在所有科学领域起着基础和根本的作用。"哪里有数,哪里就有美"
在这里,我也想把《数学之美》真诚推荐给每一位对自然、科学、生
活有兴趣有热情的朋友,不管你是从事职业,读一读它,会让你受益
良多。
吴军老师在《数学之美》中提到:"这本书的目的是讲道而不是讲
术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求
术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游
刃有余"回到我们日常的生活中,需要学习的东西、技术太多太多,如
果一味地只为去追技术的脚步,那么我们也会很累很累。然而基本的
原理却是没有怎么变化的。只见森林,不见树木,难免迷失;站在高
处向下看,也许我们一直看不到底,但是站在底处却是可以看见底的。
《数学之美》读后感 篇10
前一阵子因兴趣研究CMUSphinx这套库的应用不得要领,就去
查看了下一些语音识别的基本原理的文章,偶然碰到了数学之美。其
实浪潮之巅也是因此开始看的、结果先一步看完了,毕竟一本历史书,
一本介绍数学和语言处理的,难度不同
说实话,因为初中高中荒废了太多时间,我的英文和数学基础比
较差,我大学的数学都是勉强修过的。一直以来数学对我是一个很恐
怖的学科,也不知道为什么计算机专业对数学要求比较高。我个人就
是数学分数很低,但是专业课学的还不错,唯一好点的数学科目就是
离散数学吧,另外的工科数学分析和高等代数都是惨不忍睹的
看完这本书后,我发现我还真是低估了数学的作用,一个复杂的
语言识别过程,用统计语言模型竟然用那么简单的数学模型就解决了,
这对我的冲击很大。另一个对我影响比较大的就是余弦定理和新闻的
分类。以前那些各种三角函数的变换、三角函数,各种向量,各种空
间图形在我印象中就只能用于画设计图,或者搞空间物理化学等基础
学科的应用上,想着“这种东西和计算机编程有什么关系?要计算角
度,库里不都提供了吗?”,哪成想到改变一下思路,改变一下方法,
就简单的把那么复杂的分裂问题给解决了。现在想想我当初想法还真
是幼稚啊,可惜覆水难收,过去的时间已经回不来了,但至少我现在
明白了数学的重要性,总能想办法弥补的。
不得不说国内的教科书还真是太死板了。很多书上,先不说没讲
应用领域和这个能干吗,有些教科书连推导过程也没说明白。像我大
学时候的那几本高代高数的教科书,在某一步关键的过程写一句“显
而易见”,然后就莫名其妙的出现了结果,这让我们基础差的人情何
以堪啊,更何况我问了那些数学好的,他们想推导出那一步也要想好
久。后来换了一下同济大学版,发现同样的定理,同样的范围,就是
理解起来容易了不少。果然好书和差一点的书差别真不少。所以我就
在网上整理了一些好的数学书籍,等会儿x就贴到文后,以后慢慢补。
"技术分为术和道两种,具体的做事方法是术,做事的原理和原则
是道。这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会
从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有
掌握了搜索的本质和精髓才能永远游刃有余。” ,然后吴军先生用搜
索反作弊的例子漂亮的解释了这两种差别。我以前做过的项目里,如
果出现没想过的情况,就加一个异常处理处理特殊情况,本来很简单
的东西,愣是被我搞复杂了。现在想回来,那时候境界太低,连开始
的本质和原理都没弄清楚,就埋头搞下去了,以后要多注意点。
我一向喜欢实用性强的方法和工具,在这书里我特别喜欢阿米
特·辛格博士的那一章。吴军博士就用寥寥几页的描述中讲解了辛格博
士的处理事情的方法和原则,先帮用户解决主要的问题,再决定要不
要纠结在次要的部分上;要知道修改代码的所作所为,知其所以然;
能用简单方法解决就用简单的,可读性很重要。
不过中间有两个部分没搞明白,最大熵模型和贝叶斯网络,没搞
懂为什么能解决那些问题。贝叶斯网络还能稍微理解,少了马尔科夫
链的线性约束,更自由;但最大熵模型真搞不懂为什么那么好用,以
后继续研究。
总之这是一本很好的书,推荐大家读一下。
《数学之美》读后感 篇11
我在想,为什么我们要学习数学?也许这个问题成年人有一万个
答案,可是当我们第一次走进教室,学习数学的时候,大概率还是个
孩子,你怎么跟一个孩子解释为什么要学习数学呢?我把这个问题抛
给了一个朋友,他说:“为了提高思维逻辑能力,这是我初中老师在
第一节数学课上告诉我们的”。或者一位5岁的小朋友又会问:“什
么是逻辑能力呢?”
也许从出生第一天,我们就一直在被动的接收一些东西,父母的
劝导,老师的传授,可5岁的孩子还是会把玩具散落一地,6岁的孩子
仍然会因为父母不给买玩具而嗷嗷大哭,无论你怎么劝导一个人,怎
么劝诫一个人,他可能仍然会犯你认为会出现的错误。我记得有位教
育专家这么说:“你告诉宝宝他把玩具弄坏了,就等于丢了10个棒棒
糖”,从此以后这个宝宝可能会更加珍惜玩具。这个方法很简单,但
是貌似最有效。数学是什么?数学不就是把复杂的东西简单化么?
现在我们再回答前面的问题:为什么我要学习数学?我们可以这
么跟5岁的小朋友说:“妈妈给你10元钱,让你买酱油,酱油7元、
棒棒糖1元一个,剩下的钱你可以买几个棒棒糖?”或许想吃棒棒糖
的就会苦思冥想一番,或许未来妈妈真的给他10元钱去买酱油,结果
回来就变成了一瓶酱油和3个棒棒糖。或者再过一段时间,这位小朋
友会选择6元的酱油,因为可以获得4个棒棒糖了。他这么计算着:
7+3和6+4都可以等于10,那么如果要必须买酱油的情况下,1+9
也可以等于10。我们都知道也有1元的袋装酱油,于是9个棒棒糖到
手了。任何知识的魅力都在于自我的发现,只有你对它产生了无限的
兴趣,你就会不断的发现它的美,《数学之美》也可以变成《物理之
美》。
有些人会说,上面的例子是利益驱动型,不是兴趣驱动型,对于
一个孩子来说,你能指望他向成人那样:“我需要的不是物质世界,
我需要的是精神世界?”5岁宝宝最喜欢做得事情就是在吃和玩上面,
请问,成年人不也是如此么?这就是天性。只不过成年人的自控能力
足够大罢了。
我们回到书本上,这本书是否合适自己?如果没有专业的数学知
识,很难读懂。但是它又有着无限的魅力,让你不自觉的读下去,为
什么?因为“数学之美”,虽然大多数人看不懂里面的公式,但是能
够明白数学能解决的问题:概率统计学能够解决自然语言处理、布尔
代数能解决搜索引擎的问题、有限状态机和动态规划能解决地图问题、
向量+特征向量+余弦定理能解决自动新闻分类问题、最大熵模型解决
金融问题,看着看着我就莫名的产生了一种想要学习算法的冲动,这
不就是本书的意义所在么?
最后,我推荐几个章节希望有兴趣的读者可以关注下:
1. 信息指纹,可以让复杂的数据用简单的一串数字存储
2. 13章,提到的简单之美。当然之后多次提到
3. 余弦定理(通过向量+特征向量+余弦定理)可以判断两条数据
的相似性
4. 17章,简单密码学(对密码感兴趣的可以看看)
5. 布隆过滤器,用很少的空间存储大量的数据,从而解决黑名单
的问题(黑名单数据量庞大的时候,会增加判断某一个名单是否出现
过的难度)。
6. 29章,分治算法,虽然没有很明白算法,但是原理其实很简单:
把复杂的东西拆分成若干小的部分,然后进行逐个解决或者说各个击
破
7. 30章,神经网络,其实没那么神秘,神经就好比一个网络(马
尔科夫模型+贝叶斯网络)中的各个节点而已。
8. 31章,大数据,这章是最推荐看的,而且没有很多专业的知识,
一看就懂。不是什么都可以称之为大数据的,大数据需要满足几个条
件:数据的代表性、数据的多维度、数据的完备性。现在有很多公司
都自称自己有大数据,请不要侮辱大数据这个词。顺便说一下像百度
这样的公司,近几年都在大数据上深耕,据我了解,比如医疗上面的
项目,宁可免费做,只要求能够得到医疗方面的大数据,可见其对大
数据的重视程度。
《数学之美》读后感 篇12
在看吴军的《数学之美》之前,我并没有看过他写的《浪潮之
巅》、《文明之光》等书,但是他主理的得到专栏《硅谷来信》已经
听了很久,对吴军其人颇为了解——本硕毕业于清华大学,然后在约
翰霍普金斯大学攻读博士,02年、10年先后在谷歌和腾讯任职,是著
名的自然语言处理和搜索专家,现在主业是硅谷风险投资。他的专栏
宣传标语是“像时代领航者一样思考”,吴军也确实具有“时代领航
者”那样的视野和见识,除了专业领域之外,对于日常生活和学习、
职业发展也有不俗的见解。
《数学之美》最初是吴军做谷歌研究员时,在谷歌黑板报上撰写
的一系列文章。虽然谷歌黑板报的本意是让吴军从一个科学家的角度
介绍一下谷歌的技术,但是他却更希望“让做工程的年轻人看到在信
息技术行业做事情的正确方法”——因为吴军刚到谷歌时,发现谷歌
早期的一些算法根本没有系统的模型和理论基础,而是用“凑”的方
法解决问题,工程水平低下。国内这种情况就更加泛滥了。
后来,吴军又将这一系列博客几乎重写了一遍,写成了《数学之
美》,希望它能向非IT行业的从业人员普及一些IT领域的数学知识,
能成为茶余饭后消遣的科普读物。“世界上最好的学者总是有办法深
入浅出地把大道理讲给外行听,而不是故弄玄虚地把简单的问题复杂
化”,因此吴军尽力以伽莫夫(《从一到无穷大》作者)、霍金为榜
样,力图将数学之美展示给所有普通读者。
由于我学习过概率论、数理统计、数据结构,整本书看下来,除
了某些章节后的“延伸阅读”和马尔可夫链等内容外,其他都是可以
看懂的。其实看不懂的部分主要是在用数学推理证明文中的论点,即
使不看也不会影响阅读体验。
吴军在扉页讲道:“数学之美,首先在于其内容或许复杂而深奥,
但形式常常很简单。同时,数学之美还在于数学原理的通用性和普遍
性——数学上的一点突破,可以带动很多领域和行业的进步。”
我高中时曾因为数学的应用不明确而对其抱有偏见,直到大学接
触到了数学建模。同样,这本书中讲到了许多数学在信息技术工程领
域的应用,搭建了数学与应用之间的桥梁。
书中最令人印象深刻的例子就是通信。人与人之间的交流,也算
是广义上的通信,因此通信与我们的生活息息相关。而数学在通信中
的应用非常普遍,因为从电报、电话、电视到互联网,这些现代通信
都遵从着信息论的规律,而整个信息论的基础就是数学。不仅如此,
整个人类的自然语言和文字的起源背后,都受到数学规律的支配——
因为数字和文字、自然语言一样,都是信息的载体;语言和数学产生
的目的都是为了记录和传播信息。
一个典型的通信系统是这样的:发送者(人或者机器)发送信息
时,需要采用一种能在媒体中(比如空气、电线)传播的信号,比如
语音或者电话线的调制信号,这个过程是广义的编码。然后通过媒体
传播到接收方,这个过程是信道传输。在接收方,接收者(人或者机
器)根据事先约定好的方法,将这些信号还原成发送者的信息,这个
过程是广义上的解码。
我们平时说话时,大脑就是一个信息源,声带、空气就是如电线、
光缆般的信道,听众的耳朵就是接收器,而声音就是传送的信号。根
据声学信号推测说话者的意思,就是语音识别。
语言实质上是一套编码、解码的规则。从字(字母)到词的构词
法是词的编码规则,这套规则是完备的(有限且封闭的集合);从词
到句的语法是语言的编码规则,这套规则是不完备的(无限和开放的
集合)——任何语言都有语法覆盖不到的地方。
正是由于语法是不完备的规则,所以在自然语言处理的研究当中,
基于规则的方法走向了一条死路。随着计算机性能和可用数据量的增
加,基于统计的方法已经被广泛运用到自然语言处理中。书的第2章
到第7章,围绕自然语言处理的统计学模型,讲述得深入浅出,而且
对科学界的许多大师级人物和他们的贡献都做了介绍。
另一个绝妙的应用案例,是第14章《余弦定理和新闻的分类》。
我们在高中都学过用余弦定理判断两个向量之间的夹角大小,然而不
知道这样做有什么实际意义。如果当时我们的老师能举出文本分类作
为例子,一定能让同学们兴奋不已。
如果由人来做新闻分类,人一定会先把文章读懂。但是计算机没
有智能,根本读不懂新闻,它只拥有强大的计算能力。这就要求我们
把文字组成的新闻变成一组可以计算的数字,然后设计一个算法,算
出任意两篇新闻的相似性。
新闻传递信息,而词是信息的载体,“同一类新闻用词都是相似
的,不同类的新闻用词各不相同”。当剔除掉“的、地、得”和“之
乎者也”那样的助词和虚词之后,对新闻中剩下的实词,计算出每个
词的出现频率(实际上更为复杂,因为只是一篇读书笔记,我就简化
成“出现频率”了),再按照词在词汇表中出现的顺序,将这些频率
值依次排列,就得到了这篇新闻的特征向量。
如果词汇表中的某个词在新闻中没有出现,对应的频率值为0。如
果词汇表总共有64000个词,就会得到一个64000维的特征向量,向
量中每一个维度的大小代表每个词对这篇新闻主题的贡献。新闻就这
样,从文字变成了数字。
一篇10000字的文本,它的特征向量各个维度的数值普遍比一篇
500字的文本要大,因此单纯比较各个维度的大小没有太大意义。但
是,向量的方向却有很大的意义。如果两个向量的方向基本一致,说
明它们的新闻用词比例基本一致。
因此,可以通过余弦定理计算两个特征向量之间的夹角,判断对
应的新闻主题的接近程度。在真实的文本分类聚合过程中,需要自底
向上不断合并,合并的过程中类别越来越少,而每个类越来越大。
另外值得一提的是,这项研究的动机很有意思。当时某个国际会
议需要把提交上来的几百篇论文交给各个专家评审,把每个研究方向
的论文交给这个方向最有权威的专家。作为会议程序委员会主席的雅
让斯基教授为了偷懒,就想了这个将论文自动分类的方法,由他的学
生弗洛里安很快实现了。
考虑到多次迭代的计算量,后文又介绍了矩阵奇异值分解的方法,
将计算量缩小到1/6。
此外,书中还介绍了搜索引擎算法、拼音输入法等应用背后的数
学模型。第19章《谈谈数学模型的重要性》中用托勒密的地心说模型
(大圆套小圆)举例,讲:“正确的数学模型在科学和工程中至关重
要,而发现正确模型的途径往往是曲折的。正确的模型在形式上通常
是简单的。”
其实这本书中,除了IT领域的数学应用之外,还有许多值得深挖
的地方。看书的过程中,我有时会突然从书中的观点联想到其他地方
看过的观点。比如讲信息和情报时说到斯大林在中苏边界的60万大军
不敢轻易调到欧洲战场,就联系到《日本大败局》里日本明知必败却
执意南下进攻,偷袭珍珠港;比如讲信息论中“冗余度”的概念时,
联系到罗胖“冗余度大是优势,信息传播效率反而高”的看法;讲到
数学模型的重要性时,想到黎曼的非欧几何对相对论、超空间研究的
重大意义……
其实大多情况下,看书只是用来怡情、消遣的手段,和打牌、玩
游戏本质上是一样的。读书的过程中经常会灵光乍现,这就是读书的
乐趣。
《数学之美》读后感 篇13
重复的体力劳动已经被机器取代,重复的脑力劳动也将被AI取代。
目前的算法更多的是从统计学、概率论角度来执行,其算法依靠
人为设定执行,今后AI的介入,算法会趋于自我迭代、自我演化。
就整体而言机器的搜索、筛选、分析、逻辑推理等,都是基于当
前情况最大概率决策。即通过算法计算下一步所有可能情况的概率分
布,然后得出实现目标哪种决策成功概率最高,即为下一步的方案。
在这种环境下人最好的方式便是与机器合作,将资源分配到这些
大概率事件上,当然也会有一部分人怀有赌徒心态,将资源,甚至全
部资源分配到小概率事件上,幻想出现奇迹,而这件事就叫“创新”。
但“创新”才是真正的未来,因为从宇宙角度来看,人类诞生的
几率不到万亿分之一,而这是多么伟大的奇迹,又是多么伟大的创新!
发布评论