“数学之美”有感
睡不着,不知道是热了,还是白天睡午觉的原因,或是没什么原因。。
思索了半天,睡不着这会儿可以干什么。似乎不能干太过激烈的事情,毕竟明天还要上班。作为一个工作近一年的人,还在寻找自己身体最合适的生物钟,寻找自己最合适的休息、学习、集中思索、集中学习的时候。还是没有找到,大概平时过得不够规律吧。
晚上睡不着而明天还有事的后果,便是思前想后、左顾右盼,又万分焦虑,不知该干什么。而如lich早说了,睡不着就睡不着,又不是什么大不了的事情,一晚睡不着就睡不着。想到她,居然觉得有力量,心里有些许平静。是啊,是要做到无论在什么时候都要不慌乱啊,无论是对人还是对事。这样的心理建设一直在一直在。
好吧,心里想着lich,给自己一点力量(偷笑,lich是不是在一直打喷嚏啊)。写点什么,沉静点什么。就像一直关注的阮一峰的博客,将自己正在学习的东西用很通俗易懂的方式写出来,不仅帮助了别人,也是梳理了自己的知识。简单之美,这个放之四海而皆准的道理。任何规则、原理,如果有更简单的方法,一定是最有效的方法。而大牛们为什么牛,就是他们能将道理用最通俗易懂的方式表达出来。这个看似简单的背后,实际上包含无数的归纳、分析过程。
废话不说,看了几节吴军的“数学之美”,不仅感慨本科白白荒废了,信息论、图论这一切的东西在现在的我看来不仅是记忆,而且是美。
这本书本身讲得通俗易懂,但包含信息量极大,就目前我看的来说,讲了信息的度量方式,搜索引擎爬虫,网页索引,网页质量衡量(page rank),搜索与网页的相关性;这些都涉及到信息论。这里先不说信息的度量等信息论的基本原理。网页搜索相关的方法技术,都离不开一个核心,将所以的网页视作一个个节点,而网页间的联系就是节点之间的弧。这完全是一个图的模型。而爬虫利用图论的遍历算法自动下载保存网页,索引则是按照网页的关键词建立索引列表,以在搜索时利用简单的布尔运算拆分关键字找到相关网页,搜索与网页的相关性建立索引结果与搜索的关联性和有效性;而网页质量衡量,则是利用网页被其他网页链接的次数,并对链接网页按照其排名设置权重的方法,来对其排名,简单说来就是其他网页对该网页的评价来建立网页质量排序。
信息论相关,信息如何度量?一篇500字的满是泥知道道理的文章,和两句简单的哲理,哪个包含的信息量大?信息不能简单的以信息的多少来衡量。香农天才性的以“信息的不确定性”来度量信息——信息熵。机器对自然语言的处理,如机器翻译,语音识别等等,处理的是大量的变换复杂的自然语言,其不确定性正好可用信息论来处理。例如,机器翻译如何处理多义词,“互信息”很好的解决了这个问题。对多义词,看起语义与上下文的词义相关性如何,选择语义更相关的解释。
思索了半天,睡不着这会儿可以干什么。似乎不能干太过激烈的事情,毕竟明天还要上班。作为一个工作近一年的人,还在寻找自己身体最合适的生物钟,寻找自己最合适的休息、学习、集中思索、集中学习的时候。还是没有找到,大概平时过得不够规律吧。
晚上睡不着而明天还有事的后果,便是思前想后、左顾右盼,又万分焦虑,不知该干什么。而如lich早说了,睡不着就睡不着,又不是什么大不了的事情,一晚睡不着就睡不着。想到她,居然觉得有力量,心里有些许平静。是啊,是要做到无论在什么时候都要不慌乱啊,无论是对人还是对事。这样的心理建设一直在一直在。
好吧,心里想着lich,给自己一点力量(偷笑,lich是不是在一直打喷嚏啊)。写点什么,沉静点什么。就像一直关注的阮一峰的博客,将自己正在学习的东西用很通俗易懂的方式写出来,不仅帮助了别人,也是梳理了自己的知识。简单之美,这个放之四海而皆准的道理。任何规则、原理,如果有更简单的方法,一定是最有效的方法。而大牛们为什么牛,就是他们能将道理用最通俗易懂的方式表达出来。这个看似简单的背后,实际上包含无数的归纳、分析过程。
废话不说,看了几节吴军的“数学之美”,不仅感慨本科白白荒废了,信息论、图论这一切的东西在现在的我看来不仅是记忆,而且是美。
这本书本身讲得通俗易懂,但包含信息量极大,就目前我看的来说,讲了信息的度量方式,搜索引擎爬虫,网页索引,网页质量衡量(page rank),搜索与网页的相关性;这些都涉及到信息论。这里先不说信息的度量等信息论的基本原理。网页搜索相关的方法技术,都离不开一个核心,将所以的网页视作一个个节点,而网页间的联系就是节点之间的弧。这完全是一个图的模型。而爬虫利用图论的遍历算法自动下载保存网页,索引则是按照网页的关键词建立索引列表,以在搜索时利用简单的布尔运算拆分关键字找到相关网页,搜索与网页的相关性建立索引结果与搜索的关联性和有效性;而网页质量衡量,则是利用网页被其他网页链接的次数,并对链接网页按照其排名设置权重的方法,来对其排名,简单说来就是其他网页对该网页的评价来建立网页质量排序。
信息论相关,信息如何度量?一篇500字的满是泥知道道理的文章,和两句简单的哲理,哪个包含的信息量大?信息不能简单的以信息的多少来衡量。香农天才性的以“信息的不确定性”来度量信息——信息熵。机器对自然语言的处理,如机器翻译,语音识别等等,处理的是大量的变换复杂的自然语言,其不确定性正好可用信息论来处理。例如,机器翻译如何处理多义词,“互信息”很好的解决了这个问题。对多义词,看起语义与上下文的词义相关性如何,选择语义更相关的解释。