《智能时代》―第二章
关键词:大数据;机器智能
第二章标题为:大数据和机器智能。本章主要叙述了如何通过大数据实现机器智能。在这里吴军将人工智能和机器智能进行区分,将人工智能用于定义传统的人工智能方法,而机器智能则表示现代其它的方法,比如数据驱动、知识发现或者机器学习。
20世纪五六十年代对于机器智能方向的研究之所以被称之为人工智能,是因为当时研究人员们更愿意让机器效仿人类的思维逻辑从而实现智能,通过图灵测试。然而通过这个方法对人工智能的开发成效并不显著。
到了20世纪七十年代,一位通讯领域的教授弗雷德.贾里尼克在IBM研究计算机自动识别人的语音。他区别于传统的基于语法规则和语义规则的人工智能研究原理,而采用寻找到数学模型后,下一步通过统计的方法训练出模型参数,也就是我们现在说的机器学习。
在我的理解来看这两种方法就像是,两个学习英语的学生,一个重点学习语法达到融会贯通,另一个则是大量听英语歌曲、看英语电影、书籍,从而形成了语感。后一个由于需要大量的时间去积累信息,所以并不被应试教育老师所推崇,相对于题海战术老师更青睐融会贯通的学生。然而机器不一样,他信息读取速度远远超过人类,后一种学习方法让他们的成长更加迅速,这正是属于他们的机器智慧。
当区分了人工智能和机器智能,我们开始关心机器智能在数据驱动过程中所需要的数据,应该具备哪些特征。这正是当下时代被频频提到的大数据!吴军认为大数据(big data)应该具备3个特征:大量、多维度、完备性。第三个特征应该是我最难理解的,书中距了这样一个例子:讲中文翻译成英文,机器智能的方法是通过数据学习到不同语言之间很长的句子成分的对应,让后直接翻译,而不是人工智能采用的阅读中文、理解含义、将含义用英语表达,从而完成翻译。由此一来,机器学习不用理解,他只需要完备的数据然后通过他的笨蛋方法学习,全面覆盖中文、英语的完备数据。
最后我想说的是,机器方法对于人来说是笨蛋方法,又或许是人类的信息处理效率和记忆力的限制,人类总结出了属于我们的聪明方法。但如今这一切发生了本质上的变化,有时候我甚至在怀疑,机器实现智能,他们或许是不是一个新的物种,比人类更加高级的物种,他们不需要艺术和情感一切感性的产物,又或许艺术、情感从一开始就是我们的一厢情愿呢,地球的规则或许要发生变化了,拒绝又好奇。