静观AI:人工智能时代,我们该如何安顿自己?
引言
十一长假过后,我安排了前往寺庙打一个禅七。当我刚刚在寺院内安顿下来,打算尽可能减少手机的干扰,专心致志地禅修时,一早上就收到了好几条关于本年度诺贝尔物理学奖的消息。这些消息来自不同的群体,包括从事人工智能领域的朋友、原来物理学界的同仁,甚至是出版社的人士。一位做人工智能的朋友发朋友圈:原来我一直做的是物理呀;物理学界有人反馈诺贝尔奖竟然也赶时髦;出版社的熟人则问我最近几天是否有空,想看是否能约一场直播,谈谈今年诺贝尔物理学奖颁发给程序员这一热点事件。我的第一反应是吃惊:杰弗里·辛顿(Geoffrey Hinton)不是2018年跟约书亚·本吉奥(Yoshua Bengio)、杨乐昆(Yann LeCun)一起获得过图灵奖了吗?现在又得一个诺贝尔物理学奖,这样人工智能肯定会更火了。对于直播的邀请,我最终还是选择了放弃,因为我知道若参与到这一热点的追逐中,又吸收很多信息的话,这次禅七肯定是废了。这样我还是决定安心禅修。
禅修期间,法师教导我们参话头“念佛是谁”,不过我发觉自己已经很难参进去,静坐时脑海中不时浮现的却是“人工智能”四字。这让我想起了六世达赖喇嘛仓央嘉措的一首情诗:
入定修观法眼开,乞求三宝降灵台;观中诸圣何曾见,不请情人却自来。静时修止动修观,历历情人挂眼前;肯把此心移学道,即生成佛有何难?
“人工智能”就仿佛这其中的情人,在我静坐时不请自来。我的脑海中会像过电影一样回想自己当年从物理学研究转到人工智能行业的曲折经历,以及相关的一些感悟与反思。七天禅修结束,我在参禅悟道方面没有太大突破,倒是孕育了这篇文章的基本框架。现在诺贝尔奖的热点可能已经过去,但是我依然想分享我的感受和观点,因为我认为人工智能的热潮其实才刚刚开始,它将在未来很长时间内成为推动社会变革的主要动力之一。
然而,这篇文章依然是我的一个主观贝叶斯主义的描述,某些观点肯定是非主流的。从贝叶斯的角度,每个人的思想跟他的生活经历和接受的信息紧密相关。我会说明我的这些思想的经历根源。不管怎样, 我希望这篇文章能够为读者带来一些新的视角,不是真的跟着人工智能的热潮而心潮激荡,而是能够更加深入地理解和思考这一新技术对我们生活的可能的影响以及我们理性的应对策略。
以下是本文的提纲:
1.从物理学到人工智能(我如何从物理学转到人工智能行业)
2.感受人工智能潮流
3. 2024年诺贝尔物理学奖个人解读:人工智能时代的专业与职业选择
4.冷眼看AI:我为什么不为人工智能的技术进展欢欣雀跃?
5.人工智能时代,我们该如何安顿自己?
从物理学到人工智能
回想起来,自从2007年底我开始从事数据挖掘和机器学习算法工作以来,至今已经超过16年了。而在此之前,我一直痴迷的是物理学。那么,我是如何从物理学研究转向人工智能行业的呢?注意这里的用词是“如何”而不是“为什么”,因为如果说“为什么”,则好像我有多高的先见之明,能预见到现在的人工智能热潮。起初,我其实只是想更深入的了解互联网,希望能进入这个行业,但是却没想到竟然误打误撞地踏入了人工智能领域。
物理学学习与研究
在《我的数学学习心路》一文中,我曾经谈到我对数学的兴趣与学习数学的经历。但是我从小更明确和持续的兴趣却是物理。就像很多热爱物理的青少年一样,我初中起最大的偶像是爱因斯坦。不过由于小学五年级哥哥教会我围棋后,我也非常喜欢下围棋,所以还有一个偶像是吴清源。我在他们身上都感受到强烈的自由和不迷信权威的精神。中学时一直爱想的一个问题是:如果我们乘着飞船朝着一个方向一直飞,我们会到达哪里呢(宇宙边缘还是什么地方)?还有就是总会想时间是什么的问题。涉及到我的两位偶像,我还有一个疑问:如果让吴清源学习物理学,能否取得类似爱因斯坦在物理学上的成就。这个问题现在看来可能显得有些可笑,因为基本的结论是即使是“天才”也是要细分的:物理“天才”和围棋“天才”不能互换而仍是“天才”。但是遗憾的是,关于这一点,国家层次甚至也没有觉察,比如70年代末曾经安排一位公认的少年“神童”去学习理论物理,结果将人家害得很苦。
我初高中碰到的物理老师都很好,感觉物理老师总体上都很理智,也通达事理,我将其归结为他们所受的物理学教育的结果,这也更多促使我想学物理学。所以高考报志愿时,第一志愿我毫不犹豫地选择了物理学。我对天文有比较浓厚的兴趣,但是那时候清华还没有天文系,甚至没有教天文的老师。好在我们那一届物理系开始开设天文课,是请北师大天文系的李宗伟教授(与马来西亚羽毛球名将同名)教的天文。临近做毕业设计时,我想做天文,就联系李老师,他帮我联系了北京天文台的韩金林研究员。我就在北京天文台跟着韩老师完成了我的本科毕业设计。现在想起来,本科论文我其实也没有做出什么成果。我感觉比较有收获的是,在天文台读《普通天文学》教材时,我顿悟过时间究竟是什么的问题,感觉这才真正理解了相对论中时空与物质运动不可分的说法。

值得一提的是,本科期间我曾经经历过一场严重的精神危机。按现在的说法,我是得了严重的抑郁症,花了很长时间才走出来(此处省去一万字)。我将自己的痛苦归结于总体的应试教育体制,所以毕业后想去高中教书,但由于各种原因没有实现。这样我在本科与研究生期间是工作了三年。前两年是回到武汉的一家叫精伦电子的民营企业工作。这是一家电子技术公司,当时的主要产品是IC话机。我在公司负责IC卡话机的CPU程序和硬件测试工作,还用C51编写了一些单片机程序。第三年回北京准备考研,但是其实也没有脱产,这一年我在北京大学物理实验教学中心做编外的实验技术人员,但其实主要工作是用JSP做了实验中心的网站(http://tcep.pku.edu.cn), 主要是其中的物理实验课的学生选课与教师网络登分系统。这一年的工资相比在武汉工作时少了很多,而且也没有编制(物理实验中心的段家忯主任也知道我准备考研的打算,觉得这个岗位不太忙,很适合我),但是想到大约一百年前伟大的教员在北大图书馆兼职时也没有编制,甚至待遇比我还要差时,就感到一丝安慰。这是我后来一直还感到比较自豪的一段工作经历,因为后面工作时写的代码很多现在也没有在使用了,但据说我当时做的物理实验课选课与登分系统还在被物理学院师生使用,底层代码也没有太大变化。这种编程的成就感或许也是我后来比较安然地转行当“程序员”的原因之一。
当我决定转入互联网行业时,许多面试官都好奇问我为何不在研究生阶段学习计算机。实际上,我一直都是根据自己的兴趣来选择专业和职业道路的。当初考研时,我还是觉得物理学更能吸引我。尽管如此,我在研究生阶段选择了相对天文或天体物理更为实际的空间物理专业,这可能受到了我先前工作经历的影响。空间物理隶属于地球与空间科学学院而非物理学院。与天文学和天体物理学的观测工具——望远镜相比,空间物理的研究工具则是空间探测器。空间物理主要关注地球空间、日地空间以及行星际空间的物理现象,包括电离层、磁层、太阳风、太阳和行星等方面。在我的研究生研究中,我主要利用美国火星全球勘探者号(Mars Global Surveyor, MGS)探测器传回的数据进行火星电离层的研究。我们使用了不太为人所知的IDL语言来进行数据分析和可视化工作。在当时,我们已经确定了火星上目前不存在高级生物,但有大量的证据表明火星在过去曾有液态水的存在,且目前火星两极可能存在着以冰的形式存在的固态水。鉴于水是类地球生命存在的关键指标,研究火星上是否曾出现过低级生命成为一个重要的科学课题。回顾起来,研究生研究火星的经历非常地愉悦,因为学习了很多关于火星的全新的知识,而且几乎是国内最早做比较行星学研究的,论文很好写:先将火星探测的历史综述一番,然后再将火星电离层的研究历史与现状综述一番,然后再附上几个自己的研究成果,感觉内容很充实。

除了关心火星上是否存在生命的问题外,我发觉自己还对火星探测器和火星车有极大兴趣,想着自己如果能写出一个运行在火星车上的软件程序一定很酷。当时阅读的文献中已经出现了星际互联网(Inter Planetary Network,IPN)的概念,就是不同国家的深空探测器都可以通过IPN传输数据。对IPN的接触让我意识到互联网的出现是这个时代一件大事,自己或许应该对这个新生事物有更多了解。这样,临近研究生毕业时,我没有选择读博,而是决定转行到互联网行业。由于原来有用Java做网站的经历,我主要投递的是Java工程师的职位,并最终拿到了一个录用通知。

南极考察
但是我的Java工程师生涯却由于有去南极考察的机会而终止。在临近研究生毕业时,我得知可以申请去南极考察。本来自己那时对于南极也没有太大感觉,但是从极地中心到我们研究所做访问学生的肖清和博士给我看了原来的考察队员在南极拍摄的照片,让我受到很大震撼。

极地中心这次要招聘一个越冬队员去南极中山站负责极光与高空大气物理观测项目。这个项目的执行人往年一般是从西安电子科技大招聘,因为要负责的工作主要是仪器维护和数据采集,所以修仪器的能力反而比空间物理知识更重要。但是那一年恰巧极地中心想与我所在的高校合作,而我是空间物理专业出身,又在电子技术公司工作过两年,对于电子仪器有一些维修经验,所以顺利入选。这样我从2005年底到2007年初在南极中山站越冬了14个月。我在南极是负责电离层(测高仪、宇宙噪声接收机)、地磁(磁通门磁力计、感应式 磁力计)、极光(全天空摄像机、CCD单色全天空摄像机、扫描光度计) 等七套科学仪器的数据获取与日常维护。其中极光仪器的数据量最大,我需要将每天的数据拷贝到每张容量只有4.7G的DVD-R/RW中,一式二份(这个是中日合作项目),拷贝后总数据量有2T,满满的两大箱,一箱寄到日本,一箱带回国内。在南极,每个人的本职工作全由自己负责和做主,因为跟极地中心其他专业人士的一次邮件通信来回大概需要1个月左右。在数据的备份上,我觉得应该将原始数据与元数据(包括数据观测记录)放在一起更合理,就直接这么做了。回来跟极地中心的老师说明了这一点,他们觉得我的这种做法很好。

由于已经确定会转行做互联网,我在南极主要自学了离散数学以及数据结构与算法。还有就是终于有时间将一直想看的《C++编程思想》与《Java编程思想》这两本书都啃完了。自己还用Java编了个俄罗斯方块游戏自娱。
人文方面主要读的是《论语》和《三国志》。《论语》基本是一天读一小节,到越冬结束时也就是阅读了半部左右,后面的一半是回国后的一年左右逐渐看完的。《三国志》则是伴随着《三国演义》、央视版电视剧以及三国英杰传的游戏一起看,乐在其中。当我于2007年初回国后,得知在我离开国内的一年里,在百家讲坛上于丹教授讲解《论语》,易中天教授讲解《三国》,并且两个系列都大受欢迎,我感到十分震惊。我竟然完全无知的情况下看了这两本书!看来一个时代的潮流自有其内在的发展动力,我们未必需要向外驰求才能感知到。
南极之行是我人生中到目前为止最为难忘的一次经历。虽然已经过去十几年,许多事情仿佛只在昨日。那一年时间显得很长,而我最大的收获并非是看到了企鹅、海豹、冰山、极光等美丽的风景,而是内心经过极夜后变得平静安宁。当时的南极中山站还没有接入国际互联网。一年多不用手机、没有互联网、没有各种信息的刺激和干扰,去南极之前内心的各种躁狂、抑郁倾向一年后不治而愈。我很难想象,如果没有这次南极经历,以后自己的内心会是怎样的浮躁与随波逐流。后来进入互联网领域工作,我相信自己的生活工作环境跟绝大多数互联网人没有什么差别:接近996的工作,无尽的信息洪流,但是我会经常反观自己的内心状态,看它离在南极时的宁静、幸福状态是否偏离太远?如果状态太差,我可能会果断地停下来:去山里去寺庙去禅修,以找回自己的内心。南极之行对我的另一层特殊意义是:我本来想更多了解互联网,上天让先让我体验了一年多完全没有互联网的幸福生活。

入行数据挖掘
值得一提的是,去南极之前的2005年10月份,我在海淀图书城逛,想看看有什么好书可以带到南极去看,当时发现了韩家炜教授写的《数据挖掘:概念与技术》的第一版。看了看前言,就买了下来,因为原来只接触过数据库,数据挖掘这一概念太吸引我了。虽然在南极期间自己只是将这本书盖了两个南极的纪念章,而没有真正看,但毕竟它在自己心中播种下了“数据挖掘”的种子。

、 2007年初回来将南极考察的数据与相关工作做了交接,并经历过一段短暂的创业之后,我才开始自己新的职业生涯。再次找工作时主要投两个职位:测试工程师(因为自己原来有两年的测试经验), Java工程师(由于自己在北大工作的那一年做过JSP)。最初拿到的一个Offer是一家做手机浏览器开发的创业公司的Java工程师职位。在快要去报到时,我又得到风行在线的面试通知。我投递是测试工程师职位,但是HR拿出一份职位描述文档出来,说看我的情况,很适合他们要招的数据挖掘工程师职位,问我想不想做。我看了看那个职位描述,的确有点怀疑是特地为我而写的(要求数学、物理相关硕士以上学历,而一般的编程职位是很少提到物理专业的)。当时数据挖掘还不为大众所知,大数据也完全不像现在这么火热。由于带去南极的那本《数据挖掘》的影响,我算是对数据挖掘有一丁点了解,所以就答应了下来,做了风行第一名数据挖掘工程师。当时公司在职总人数45人,我的工号75号。这些年来,数据挖掘、机器学习、大数据、人工智能等各种新名词不断进入大众视野,我见证了这个行业如火如荼的发展,也庆幸自己入对了行。所谓“男怕入错行,女怕嫁错郎”,数据挖掘是一个对数学要求比较高,也是一个经验与积累非常重要的行业。我作为大龄转行男青年,能碰到这个不用太担心自己年龄的行业,实在可以说是万幸。
感受人工智能潮流
我其实一般不说自己是做人工智能的,而是说数据科学或者机器学习算法的,自从我2007年底在风行担任“数据挖掘工程师”以来,这个领域相关的热点词汇就一直在改变:“大数据“、“数据挖掘”、“推荐系统“、“计算广告”、“机器学习”、“深度学习”、“元宇宙“、“人工智能”、“ChatGPT”等等,到现在似乎每一家互联网公司都巴不得将自己定义为一家人工智能公司。“人工智能”这个词实在是太大了,似乎包括了以上所有方面。在我看来,一名专业人士应该清楚知道自己所做事情的本质,知道它能提供什么核心价值以及其界限。在所有这些词汇中,“数据科学”应该是最好地描述这波热潮本质的词汇。

以上是最常见的一种数据科学维恩图,揭示了数据科学的主要特征以及数据科学家的核心技能。维恩图的三个大圆,代表着数据科学作为一门交叉学科最重要交叉的哪三方面的知识:计算机科学、数学与统计、业务与领域专业知识。这三个大圆的相交区域可以说概括了数据科学家需要掌握的三种核心技能:软件编程能力、数据分析能力、机器学习原理的掌握与应用。
我其实不太同意将机器学习算法工程师或者数据科学家作为传统软件工程师的一种细分,因为这将忽略两种职位的核心技能的差别。相对于传统软件工程师,数据科学家最重要的还是要掌握机器学习和数据分析的技能。概率统计和机器学习的掌握才是数据科学家相对于软件工程师的核心竞争力所在,所以在数据科学领域才有“学计算机的都在学统计,学统计的人都在学计算机“的说法。什么专业转行数据科学最容易呢?关于这个问题,我曾经跟获得我们算法大赛第三赛季冠军的UCL大学袁帅博士交流过,他说他们讨论的结果是物理专业转行机器学习最容易,我还是比较认同。
转行机器学习算法行业,我最大的体验的确是我其实还是在做物理。从研究生时做火星数据分析,南极收集极光数据,到公司做数据挖掘,这似乎是一脉相承的。我自己总结,数据科学相比传统软件工程最大的区别是它本质是自然科学(物理学)而不是数学和逻辑。其主要对比如下:

工作经历上,我主要在风行、品友互动和Keep等公司使用机器学习技术做过个性化推荐、程序化广告、NLP相关工作。
我在风行主要以做推荐算法为主。2008年,国内的推荐系统社区逐渐形成。受Netflix电影推荐大赛的影响,推荐系统技术逐渐火热。我们作为一家同样提供在线电影服务的公司,自然开始尝试做推荐系统。主要是有两个产品应用场景:一个是电影关联推荐,推荐结果展示在用户观看完一部电影后或者电影详情页作为关联推荐结果展示;另一个用户个性化推荐,展示在用户个人页面。开始时还是觉得挺难的:记得当时结识了一位日本博士毕业回来后准备做推荐系统创业的朋友;我将部分用户ID的电影观看ID数据给了他;他给每个用户做了一个电影推荐结果,肉眼可见就比我们自己做出来的要好很多,这让我觉得神奇。后来对于数据和算法更加熟悉后,就基本复现了他的推荐结果,神奇的协同过滤!个性化推荐技术其实是现代互联网公司的支撑技术之一。抖音、快手、小红书等公司的成功和发展其实非常依赖于推荐系统技术的应用。
2013年1月,我入职品友互动做程序化广告。当时他们正在筹办一场世界范围的RTB广告DSP算法大赛,我入职后迅速参与这场后来在业界产生了相当影响的算法大赛的筹备和组织之中。这是一次长达一年分三个赛季的比赛,比赛之后的数据集后来整理后对外进行了发布,我也有幸以第一作者的身份在ADKDD发表了一篇介绍此数据集的技术文章。这个数据集是国际范围内RTB广告领域第一个公开数据集,广告数据集中很有名的还有Criteo公司发布的数据集,不过这个数据集是在我们的数据集发布之后的两年后的2016年。
当时RTB广告的概念正从美国引入到国内,大公司纷纷构建自己的ADX,而中小型的广告公司则基本都是DSP。我在这里参与DSP算法平台的设计与搭建。我们用了大概半年时间做算法自动化的工作,然后做CTR预估、竞价策略优化、转化优化、Ranking/Pacing、PDB投放算法等。DSP广告算法优化是我职业生涯碰到的最有意思的算法问题之一:首先它有极大的商业价值,因为优化效果直接关系广告主的ROI和广告公司的收入和利润;另外它也足够复杂,需要利用很多概率统计和机器学习的知识才能优化好。在投放系统、数据、算法的加持下,品友DSP每日的预算消耗在一二年内增长了10倍以上。
在品友互动期间,基于做CTR/CVR预估工作的需要及自己的爱好,有两年我连续阅读完对我深有影响的《概率论沉思录》。孔子说“学而实习之,不亦说乎”,在技 术领域,恐怕没有什么比学习理论知识并能在实际工作中应用并加深对理论的理解更令人愉悦的事情了。
2018年9月,我以算法架构师的身份进入Keep人工智能中心。不过主要做社区推荐和站内搜索,一年多后我转而去内容挖掘(NLP)相关的事情,做了一些知识图谱方面的探索。基本想法是想做一个运动健身领域的行业知识图谱,为Keep用户提供专业的知识指导。不过总体而言,我觉得自己做得不太成功:NLP是一个全新的领域,跟推荐/广告还是有很大不同。当时的聊天机器人技术虽然各家都在做,但是我总体感觉本质上还是挺傻的,因为机器人没有真正对语言的感知。后来ChatGPT的出现显然改变了原来使用知识图谱技术做问答的现状。
在品友工作期间的2016年3月,发生了DeepMind开发的人工智能围棋程序AlphaGo与李世石的世纪围棋之战。那时距离我的偶像吴清源先生去世(2014年11月)是一年多的时间。我一直关注围棋AI技术的发展,包括已故中山大学化学系教授陈志行研发的“手谈围棋程序。在比赛前不久,我还参加过一个国内的一线公司的围棋AI团队举办的一个沙龙,最后问他们开发的AI实力有多少时,他们还支支吾吾不肯透露,我只能推断他们做出来的AI甚至没有达到业余初段的水平。AlphaGo战胜李世石,标志着人工智能在围棋领域取得了重大突破。此次比赛引起了全球范围内对人工智能技术的关注和讨论,也为人工智能在围棋等复杂领域的发展奠定了基础。值得一提的是,AlphaGo的创始人之一正是今年获得诺贝尔化学奖的哈萨比斯,只不过原因是由于使用类似技术开发的AlphaFold2对于蛋白质序列预测的贡献。
AlphaGo与李世石的战绩大家应该都是知道的。我觉得最有象征意义的是李世石唯一的胜局第四局:那时候AlphaGo的总体水平肯定已经比李世石高了,但是李世石仍然仅仅通过前面三盘的对局经验的学习在第四局捕捉到了AlphaGo的缺陷而赢回了一局,这说明人类的学习能力其实非常卓越,人类与AI的学习方式是不太相同的,也让人看到了未来人类与人工智能争夺主导权时的希望所在。要知道AlphaGo是学习了众多人类棋手的棋谱才达到人类顶尖棋手的水平。当然,后来AlphaGo Zero完全不使用人类棋谱,通过自对弈获得了更强的实力,但也并没有否定人类下棋的基本思维过程。
关于AlphaGo战胜人类顶尖棋手的意义当然还有很多值得讨论之处,不过我们其实没有必要悲伤,就像接受电脑在数学计算上早就胜过人类一样。中国古人对于下棋的基本态度其实是“奕之为数,小数也”,我们其实该自豪于发明围棋之人的智慧。

2024年诺贝尔物理学奖个人解读:人工智能时代的专业与职业选
大家都应该已经知道, 2024年诺贝尔物理学奖授了予约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton),理由是,他们使用物理学工具训练了人工神经网络,这些方法是当今强大机器学习的基础。他们的工作,让如今的深度神经网络和深度学习得以诞生。John Hopfield创造了一种可以存储和重构信息的结构,而Geoffrey Hinton发明了一种可以自主发现数据特征的方法,这种方法对现在使用的大型人工神经网络变得至关重要。
从专业的角度,John Hopfield曾经获得物理学博士学位,先是作为固定物理学家,后来却转向了物理学与生物学的交叉领域,他的获得诺贝尔物理学奖的成果也是这种跨界研究的成果,他开发神经网络模型当然实际上是为了解释大脑如何回忆记忆,不过却没想到成为现代人工神经网络技术的基础。Geoffrey Hinton是1970年在英国剑桥大学获得实验心理学学士学位,此后于1978年在爱丁堡大学获得人工智能博士学位,在我们现在看来是跨专业读博,而且他做人工神经网络时可是低谷期,因为大家都不看好人工神经网络。
2024年诺贝尔物理和化学奖都颁发给人工智能相关研究,这说明了什么?其实也没有什么,结论是大家都可能直觉感受到的:人工智能技术已经成为这次社会变革的核心技术,叠加在原来的互联网与大数据变革之上,甚至可以毫不夸张地说,现在的人工智能就如同20世纪物理学上相对论与量子力学。我在解读《概率论沉思录》一书的意义时曾经说过,20世纪初概率论的公理化与统计学的发展,其现实重要性,其实并不亚于相对论与量子力学。现在的数据科学与人工智能正是概率统计革命的延续。
物理学当然是一门很重要且基础的专业,经典物理学可以说是科学的典范,而20世纪的相对论和量子力学又引发了新一轮物理学革命。但是现在要在相对论与量子力学领域再要做出极有影响力的工作恐怕是比较难的,所以杨振宁先生才反对建大型对撞机,并且对量子力学评价说“盛宴已过”(The Party is Over)。如果说要我对原来物理学界的同行说点什么的话,我觉得一是可以多关注一些物理学与其他领域的交叉学科,二是可以关注一下人工智能技术,特别是需要做大数据分析与挖掘的学科,比如天文与空间物理等,现代最新的人工智能算法可能成为很大的辅助工具。另外,我希望所有理工科学生都能多了解一些贝叶斯概率论与因果推断的知识,因为这涉及到我们如何理解科学。
那么在现在的人工智能时代,我们该如何选择自己的专业与职业?学物理的是否都应该转到人工智能方向来?是不是应该全民转向AI?其实大可不必。从专业选择的角度,我认为一切不遵从自己内心热爱与天性的专业选择都是难成大器的。这样说来,网上某些所谓十大高薪专业或十大冷门专业等其实都只是一个统计结果,如果不跟个人的爱好与天赋结合就没有多大意义。从人的一生来说,真正从事大学专业本行的人是不多的,大学其实主要还是为一个人的未来职业和生活打下基础的阶段。这么看,如果大学能学一个培养人的某一方面的基础,无论是科学基础的物理学,数学基础的数学,人文方面基础的哲学、历史,甚至心理学都可以说是好专业,因为大学本科没有浪费时间学习未来可能完全无用的知识。
人工智能当然很长时间会是社会热点,但是选择人工智能行业是否明智我其实不太肯定。如果要我重新选择,理工科本科我会选择物理或数学,如果我喜欢文科的话,我可能会选择哲学或心理学等学科,要说人工智能之后的热点是什么,我肯定会说是人文。互联网与人工智能的叠加会让未来这个社会的心理问题变得更为严重:抑郁、躁狂、焦虑情绪会越来越普遍,在机器人与人类并存的时代,我们肯定需要回答何以为人的问题,能解决人的心理问题的学问也将成为显学。维纳的《控制论》(副标题:关于在动物和机器中控制和通信的科学)是20世纪中叶的一本极有影响力的著作,其基本思想是无论是机械系统、生物系统还是社会系统,它们都可以通过信息和反馈来进行控制和调节。系统通过接收外部和内部的信息,进行相应的调整,以维持或达到某种预定的状态。控制论就是一种能实现人类与机器之间通信的科学。这种科学某种程度在当代社会已经普遍应用了。然而其根本问题在于人与机器等同化,但却忽视了人其实不是机器,他是有情感、情绪、人性,甚至可以说不愿意被机器控制,也不愿意成为机器的有血有肉的人。
值得一提的,2023年,Hinton从谷歌辞职时,曾经发出警告,称生成式人工智能的商业应用构成多重严重威胁,比如计算机生成的错误信息以及就业市场的不稳定。他警告说,从长远看,自主人工智能系统可能会对人类构成严重威胁,甚至对自己的部分研究工作感到后悔。其实不止是Hinton,多名有识之士都表达了类似的担忧,作为20世纪的相对论和量子力学衍生品的原子弹至今对人类的命运构成了严重的威胁。而如果超越所有人类智能的超级人工智能能够实现且轻易为人制造,谁又能保证它不被用来制作杀伤性武器或者用来毁灭我们自己呢?
冷眼看AI:我为什么不为人工智能的技术进展欢欣雀跃?
首先说明,我为什么虽然身处这个行业,却将自己更多视为一名冷眼旁观者,而不是技术狂热者,尽管我对于技术本身,尤其是概率论、机器学习、因果推断等基础理论有很高的热情。但是,一旦涉及到技术应用,应用新技术方面,我就变成了一名保守主义者:2008年前后曾经写过一阵子博客,但是随后停止;对于现在最火的两个短视频App,我其实很少使用;甚至是公众号和视频号等,虽然我多年前就已经意识到其威力,但是却迟迟不想介入,更多是一名观察者。直到几个月前随着我翻译的《概率论沉思录》出版,我才参与了第一场直播,也开始写这个公众号。但是未来我也会带着自己的初心和价值观来做这件事,而不是要简单将自己发展成一名“网红”。为什么呢?
首先, 我觉得国内现在对于“人工智能”的宣传太过有偏。记得在我们在2013年举办RTB广告DSP算法大赛期间,曾经有一名记者到公司采访。我在公司的一间会议室接待了她。她一进屋就问“请问深度学习”。我吃了一惊,然后淡淡回答说“Oh No,我们不做深度学习……”,估计这位记者当时应该感到非常失望。当时正是“深度学习”火爆的时间,网络上充斥着对“深度学习”的各种宣传和迷信,如同现在的“大语言模型”。我其实可以证明,在程序化广告算法优化这个实际重要的大问题中(可以分解大概10个左右小问题),“深度学习”只是在其中的CTR/CVR预估等大概两个左右的小问题可以作为浅层算法模型的替代。深度学习并非解决一切问题的灵丹妙药,ChatGPT也不是。人工智能是一个很大的领域,不只是“深度学习”与“大语言模型”,而媒体大多数只是围绕着其中一个最大的热点在宣传。
在这种有偏宣传的影响下,现在有一种非常不好的倾向是,机器学习和人工智能专业的研究生毕业时通常只会调包使用一些深度学习模型,对于传统机器学习的掌握却不屑一顾,更遑论更基础的概率论与统计学了,这对于希望进入工业界工作并取得成功的人来说是非常危险的。最重要的,现在的深度学习模型都已经发展得非常复杂,用户往往没有参与底层模型的设计,也不太可能去修改底层的模型,那算法工程师在这里体现的核心价值是什么呢?算法工程师的角色是否可以被软件工程师代替了?自从深度学习三巨头共同获得 2018 年的图灵奖以来,机器学习与人工智能界对于深度学习的追捧和膜拜更是到达顶峰。我其实希望读者作为专业人士对深度学习以及现在的大语言模型能保持冷静态度。还是那句话:所谓专业者应该是对某一技术的能力、局限性与应用范围有清晰认识之人。如果实在在图灵奖的光环下不敢直视,建议可以看看同为图灵奖得主的 Judea Pearl(贝叶斯网络之父,现代因果论的开创者)的书籍和文章,至少看看作者较为科普的《为什么——关于因果关系的新科学》。作者认为因果关系的学习者必须熟练掌握至少三个层级的认知能力:观察能力(seeing)、行动能力(doing)与想象能力(imaging),分别对应着关联、干预和反事实,这些年来广受推崇的深度学习算法(深度神经网络)仍然处在因果关系之梯的最低关联层,只依赖深度学习的人工智能其实离强人工智能还很遥远。
其二,现在的互联网与人工智能技术总体而言仍然是缺乏善恶道德价值观与人文精神的纯技术,在中国尤其如此。
互联网和人工智能技术的商业应用往往更注重经济效益而忽视了社会责任。一些企业为了追求利润最大化,不惜牺牲消费者的福祉。
我真的很不喜欢国内某主流搜索引擎,因为本来我是想搜索一点有用的信息,却经常会不经意被引导看了许多首页推荐的爆炸性新闻,从而浪费了很多时间。我现在经常会尽量使用Bing搜索引擎来避免这种干扰。又比如多年来备受争议的竞价排名机制以及自然搜索与广告难以区分的设计人家一直就不改,为什么?因为一来这不违法,二来改变了就会影响商业收入。按中国古代的说法,是典型的以利为利,而不是以义为利。作为一个有巨大社会影响力的公司不违法就做,往轻了说是缺(乏道)德(心),往重里说是丧绝天良(说这话可能会得罪很多人,我想说的是创始人其实要负更多的责任,春秋责备贤者,正是此意。其实我们普通人内心为物欲所蔽,也很容易丧失本心)。但这其实就是互联网的常态:善恶参半、既当天使又当魔鬼。
OpenAI 2022年推出的ChatGPT引发了这一轮的大语言模型热潮,但是值得注意的是,OpenAI创立时定义为一家非盈利公司,其使命是确保通用人工智能造福全人类。这是有明确道德价值观的。其后又发生由于对商业化担心引发的“宫斗”风波,其核心人物之一正是本次诺贝尔物理奖得主Hinton的学生,作为首席科学家的Ilya Sutskever。这至今说明OpenAI的创始人对于纯商业化的人工智能技术的风险还是有深刻认识和警惕的。
还有值得注意的是,斯坦福大学李飞飞教授创立了HAI(Human-Centered AI Institute,以人为本人工智能研究院),她强调HAI发展需要遵循三个原则:
- 为了让人工智能更好地服务于我们的需要,其必须包含人类智慧中的多样性、细微差别及深度。
- 人工智能的发展应与其对人类社会影响的长期研究相结合,并据此加以指导。
- 人工智能的最终目的应该是增强我们的人性,而不是削弱或取代它。
这也是包含明显的人文精神在其中。反观国内,大语言模型火爆后,各路大佬蜂拥而上,纷纷成立商业化大模型公司,要在这一浪潮中分一杯羹。我们将如此多的金钱和人力投入到近乎重复的抄袭式竞争和内卷,没有HAI,不谈论AI如何造福人类,不谈论AI的风险,只谈技术本身和商业利益,这真的正常且有意义吗?
国内其实也有良心App,其中一个就是微信。这款由腾讯公司开发的社交平台,不仅在中国大陆地区拥有庞大的用户基础,更在全球范围内有着广泛的影响力。但其实微信的背后隐藏着一个关于坚持与初心、良心与责任的故事。这一切都要从微信的创始人和产品经理——张小龙说起。在加入腾讯之前,张小龙就已经是一位技术界的传奇人物了。他曾是Foxmail的开发者,这是一款在当时非常受欢迎的免费电子邮件客户端软件。在那个年代,大多数人都认为“免费”就意味着没有商业价值,他为此还被某著名互联网大佬质疑无法盈利,因此当张小龙带着他的Foxmail加盟腾讯时,甚至有人对他的盈利模式表示怀疑。但张小龙并没有因此而改变自己的理念。他认为,好的产品应该首先满足用户的需求,而不是仅仅为了赚钱。这种对用户体验的关注和对产品质量的追求,最终使得微信成为了一款深受用户喜爱的应用。它不仅仅是一款通讯工具,更是连接人与人之间的桥梁,让人们在数字世界中找到了归属感。正因为创始人的初心与坚持,微信才能赢得亿万用户的心,成为中国乃至全球最受欢迎的应用之一,也成为孟子所说的“保民而王,莫之能御”的典型。
其三,现在的宣传过于强调人工智能给社会变革所带来的正向影响,而倾向忽略其局限性、负作用与危险。
就比如现在红火的“大语言模型”,我们实际去使用一下并且扪心自问:它真的如此强大且极其有用吗?即使是最新的GPT4以后的模型,就比如我原来在Keep想做的运动健身知识问答(健身AI)系统,恐怕也不是套上一个GPT的外壳就可以对用户提供服务的。当然,我们对于LLM的本质、它是否能真正推理能力、顺着此技术路线是否能达到AGI等问题都可以有讨论,但是就目前的感受而言,大语言模型更多似乎是读了很多书,但是更多是死记硬背,没有深层理解,根据原来囫囵吞枣读的书拼凑出一个相对靠谱答案的人。对于性命攸关、对于答案可靠性要求很大的领域,我们肯定不敢轻易相信并使用大语言模型提供的答案的。没有彻底解决“幻觉”问题的大语言模型,其输出结果中可能九份对一份错,如果我们没有专业的评判力,也很容易受其误导。生成式AI技术普及后,先不说我们能受其多少好处,一个可见的坏处是AI生成水文甚至谣言的成本会大大降低,互联网的总体数据量会大大增加(存储与处理成本也会随之增加),而其信息密度又会进一步降低。则这难道不都是值得我们警惕的吗?
人工智能时代:我们该如何安顿自己?
以上做了这么多铺垫,最后还是说说在这个已经到来的人工智能时代,我们该如何安顿自己。我的建议主要是以下三点:
1. 保护好自己。
为什么首先是保护好自己,而不是利用人工智能呢?因为人工智能是个利器。佛教《四十二章经》曾说:“佛言,财色之于人,譬如小儿贪刀刃之蜜甜,不足一食之美,然有截舌之患”。要我对现在的手机、互联网、人工智能做个比喻,就相当于一把一侧是蜂蜜、一侧是剧毒的利刃,而这把利刃却变得越来越锋利。
手机、互联网、人工智能是好东西吗?你当然可以可以说是好东西。但是这其实是有条件的,就是明智地且有选择地使用。若毫无节制、毫无选择,则会弊大于利。手机给我们带来了极大的便利,但是其实也是浪费我们时间的最大根源;互联网给我们获取信息带来了极大的方便,但是现在问题却是很多人接收了太多的信息,互联网信息成为乱人心的利器。
我在南极感受比较深的一本书是阿尔文·托夫勒1970年写的《未来的冲击》。虽然那时距离书籍初版已经接近半个世纪,读起来完全不觉得过时,而且书中描述的很多倾向在手机互联网时代还在加剧。其中写道“我们创造了一个如此短暂,陌生和复杂的环境,使亿万人限于适应能力崩溃之境,这就是所谓未来的冲击”,而对于其主要原因,其总结是“未来的冲击是过度刺激的反应……一个人接受的信息超过他所处理的极限时,可能导致紊乱”,这不正是互联网社会信息带给我们的主要影响之一吗?互联网本来是要解决信息匮乏、寻找信息困难的问题,但是现在的主要问题是我们很多人接受的信息太多了!我身边认识患抑郁症、躁狂症的朋友就有好几个,认识的朋友的至亲自杀者也不止一人,难道还不值得我们警醒吗?
技术虽然给我们带来便利,但是也不是没有代价的,代价经常是丧失合道而神安的生活。《庄子.天下》中曾经讲的一个故事值得我们深思,故事是说子贡南游于楚,回到晋国时碰到一位老人用非常原始的方法灌溉。
子贡曰:“有械于此,一日浸百畦:用力甚寡而见功多,夫子不欲乎?”为圃者忿然作色而笑曰:“吾闻之吾师,有机械者必有机事,有机事者者必有机心。机心存于胸中,则纯白不备。纯白不备,则神生不定;神生而不定者,道之所不载也。吾非不知,羞而不为也。”
北京大学有一位哲学家张祥龙先生,思想非常有深度。这种深度思考的基础却是作者在北大工作常年没有使用手机,家里只有座机。他实际上是抵抗了很多年手机,这也促成了他思想的深度,这跟庄子故事中拒绝使用机械是类似的道理。我回想自己的经历,其实思想上最有收获的也是在南极那一年多,也就是被强制隔绝了手机与互联网的一年。在后面的生活中,我也曾经多次想回到类似南极的那种生活。在这个忙碌的时代抽出一周甚至一两个月去寺庙禅修,期间断绝手机互联网,但是每次都是收获满满。《禅林宝训》中也有一个故事:
雪堂曰:予在龙门时,昺铁面住太平。有言昺行脚离乡未久,闻受业一夕遗火,悉为煨烬。昺得书掷之于地,乃曰:徒乱人意耳。(《东湖集》)
这个故事大致是说,智昺禅师出外游方参学时,离乡不久,就听到消息说他的受业师住处失火,所有的财产都化为灰烬。后来果然收到了受业师的来信,智昺禅师看了之后将书信扔在地上,说:“反正都已经烧光了,写信告诉我又什么用,徒然扰乱我的心意罢了!”我们初一看,这位智昺禅师似乎太不通人情:你的师父庙里着火,写信告诉你,你不生怜悯之心,反而将书信扔在地上。但是仔细想来,道理不就是这样吗?庙已经烧了,写信告诉我除了乱我的心外又有什么用呢?我们在互联网时代追逐的热点新闻就是类似这样的:除了“徒乱人意”外其实没有实际价值。互联网链接了地球上几十亿人,中国也有十亿人连着互联网。这数十亿人中按概率该有多少思想极端、行为极端的人,这其中又会发生多少光怪陆离的事情呢?这些人这些事都可能成为一时的热点,让我们的心情为之激荡:愤怒或感叹。但是这真是我们应该去追逐的东西吗?
保护好自己的核心是保护自己的内心。保护自己的内心不受过多信息的刺激,不受各种广告的诱导而物欲难遏,或者因看各种小视频而心潮起伏。《黄帝阴符经》有言:”心生于物,死于物,机在目“。保护自己内心的要点首先在管好自己眼睛和耳朵,做到“非礼勿视,非礼勿听”,然后有时间的话与这些技术产品保持距离,学点静坐、冥想、禅修之术并通过修习来反观并找回自己的内心。
2. 了解相关技术,有必要时利用它,但是最好对其局限性有比较清晰的认识。不要迷信,也不要焦虑。如果你利用人工智能技术做产品盈利,请分清善恶,赚良心钱。
那么我还需要了解与使用人工智能吗?当然需要。上面谈到手机与互联网带来便利的同时可能给人带来损害,但是建议也是有限制、有目的的使用而不是完全禁绝(在现代社会可能也很难做到)。新的人工智能技术也是如此,我们可以甚至应该去了解,有必要时就去使用。目前的大语言模型的不足与局限性前面已经说明,但是也的确在很多方面给我们提供辅助。目前的大语言模型技术能否能通往AGI以及AGI什么时候会实现现在还不得而知,技术前进的滚滚车轮也基本不受我们大多数人控制,我们只需要以平常心使用已有的技术即可。但是一定程度上掌握其基本原理还是有必要的,这样不至于迷信其效果,也不会将其输出的结论作为上帝的判断
现在国内有一种不健康的倾向,就是利用人工智能制造一些不必要的焦虑:就好像不花钱买课学习人工智能,就会被社会所淘汰;又仿佛学习什么都没用了,反正将来什么人工智能都会比人强。但即使是五年后出生的孩子也要生活下去,他们也会继续有人获得诺贝尔物理学奖、化学奖,但是肯定未必是一出生就只学习人工智能。
如果我们要利用人工智能技术来盈利,那么有基本的道德心及善恶分别心就十分重要。不管是按传统佛教、道教还是儒家道德伦理,无论为恶还是为善都会有业报存在。这方面法律当然是底线,但是法律之上还有道德。技术从来就不是中立的。如果没有道德甚至法律敏感性,果报难以预料。我原来一起做技术的同事中,现在身陷囹圄的不止一人,由于被国家追逃而流亡海外的也有,都是活生生值得借鉴的例子。
3. 关注人文, 多学习些科学技术之外的知识,看到成名成家之外生活的意义。
我读初高中的时候,那时候非常强调数理化的重要性,说“学好数理化,走遍天下都不怕”。后来就花了很多时间在物理和数学之上。当然这些知识对于成为技术专家很重要。但是我自己会越来越感受到人文的重要性,因为这是人之所以为人的基础,是每个人都需要关注的学问。中国传统文化中讲学习时其实并不重视纯粹客观的知识,而是重视跟生活息息相关的方面,一般称为身心性命之学,牟宗三先生称之为“生命的智慧学”。人工智能时代,我们也只有通过人文来体会我们与机器与人工智能的差别所在,即人何以为人。这方面就不展开讲了,这篇文章已经太长了。将来希望写一篇文章:人工智能时代,我为什么反而更重视人文?
我在微信上开了公众号“概率论沉思录”,专门解读《概率论沉思录》、科技哲学、科技人文等相关内容。欢迎关注!
火星南极人的最新日记 · · · · · · ( 全部 )
- 不懂贝叶斯真的可能害死人——武大图书馆事件的概率论沉思 (13人喜欢)
- 大数据时代为什么贝叶斯方法反而有天然优势? (4人喜欢)
- 概率论的身份之争:数学还是自然科学? (2人喜欢)
- 为什么说不懂概率论就不可能真正理解人工智能? (1人喜欢)
热门话题 · · · · · · ( 去话题广场 )
-
加载中...