做不了 AlphaGo,但或许能做 Elon Musk; 论第一原则的胜利
/ @峰哥 /
本周 AI圈里重磅消息:Alphago Zero (Alphago 最新版) 在无人指导下,自学成才。仅用三天时间,全面超越之前战胜李世石、柯杰的旧版 Alphago. 这除了让人类更多焦虑和危机感,能给咱们带来什么借鉴启发呢?
/自学70小时候后,AlphaGo Zero 已经超越人类。图片转自 Deepmind.com/
AlphaGo Zero (以下简称 "Zero")这次超越老版 AlphaGo, 不仅仅是在最终的棋力,而是在各个方面:
-训练所需的时间和棋局大大减少;
-所需的处理器(也就是计算量)大大减少,不到原来的 20%;
-设计结构大为简化
Zero 能够做到这样全面碾压,(目前看来)很大一个原因是:Zero 不是通过人类的棋局来学习,而是仅仅根据围棋规则,自行推导行棋方法。由此推测,人类两千多年总结的围棋规律,有很多地方是错的。这些错误的思路体现在人类的棋谱中,导致之前通过人类棋谱学期的 AlphaGo 被带上错误的道路。虽然最后仍然战胜人类(在错误的道路上,走的更远?),但这终究是一个有局限的方向。而 Zero,不为人类的错误经验所羁绊,从最根本的围棋规则出发(可以理解为围棋世界的物理定律),形成自己对围棋的理解,最终全面战胜人类,以及被人类思想所束缚的老版 AlphaGo (当然,所谓 “对围棋的理解” 这是拟人的说法)。
#血肉之躯的陷阱#
Zero 暴露出了人类思维局限。但是因为它超越人类太多,所以人类棋手目前(或许永远?)无法理解到底局限在哪里。但是偶尔有我们能够看懂的,举个例子:人类棋手过度看重赢了多少,而不是赢棋的概率(overvalue margin of victory over probability of victory). 举个例子,如果下一步棋有 A、B 两种选择。选择 A 是 80% 的可能性赢 10目;而 B 是 99% 可能性赢 1目。人类棋手更倾向选择 A;而 AlphaGo 会选择 B。
选择 B 的逻辑并不奇怪,(甚至)人类也能理解:棋局最终只分胜负,至于胜 10目,还是胜 1目,并没有区别。To be fair, 人类并非不理解这个道理(甚至围棋谚语中也有 “赢棋不闹事” 的说法),但是人类并没有准确计算赢棋概率的能力,所以道理虽懂,但无法把握。所以只能退而求其次,用领先的目数来估测赢棋概率。这导致了很多误判。
略有伤感的是,即便我们明白了其中道理,这个思维误区是永远无法修复的。人类永远无法以 “血肉之躯” 的大脑来精确计算赢棋的概率。
#第一原则的胜利#
“血肉之躯” 一时无法改变,但是我们仍可以借鉴 Zero 的成长轨迹,从零开始考虑一个现象,摆脱前人错误经验的羁绊。英文对此有个形象的描述,叫 first principles,硬翻译过来,就是 “第一原则”,即最根本的,不容质疑的规律(往往是数学、物理等硬科学中,已经被千锤百炼,反复验证的规律)。
特斯拉创始人 Musk 就特别擅长运用[第一原则]。当年他决定做电动汽车;旁人觉得他疯了,因为 “地球人都知道”,电动汽车面临成本高,续航有限等等 “不可逾越” 的障碍。Musk 以他一贯的思维,从第一原则出发:电池的构成有哪些材料?这些材料的市场价如何?近几年价格走势如何?从这些最基本的信息,经过一番计算,他觉得电动汽车可行。现在证明,果然可行。这是第一原则的胜利。
祝大家 always remember to go back to first principles.
======
本文转自微信号:峰哥公号
扫码关注 fenggegonghao
本周 AI圈里重磅消息:Alphago Zero (Alphago 最新版) 在无人指导下,自学成才。仅用三天时间,全面超越之前战胜李世石、柯杰的旧版 Alphago. 这除了让人类更多焦虑和危机感,能给咱们带来什么借鉴启发呢?
![]() |
/自学70小时候后,AlphaGo Zero 已经超越人类。图片转自 Deepmind.com/
AlphaGo Zero (以下简称 "Zero")这次超越老版 AlphaGo, 不仅仅是在最终的棋力,而是在各个方面:
-训练所需的时间和棋局大大减少;
-所需的处理器(也就是计算量)大大减少,不到原来的 20%;
-设计结构大为简化
Zero 能够做到这样全面碾压,(目前看来)很大一个原因是:Zero 不是通过人类的棋局来学习,而是仅仅根据围棋规则,自行推导行棋方法。由此推测,人类两千多年总结的围棋规律,有很多地方是错的。这些错误的思路体现在人类的棋谱中,导致之前通过人类棋谱学期的 AlphaGo 被带上错误的道路。虽然最后仍然战胜人类(在错误的道路上,走的更远?),但这终究是一个有局限的方向。而 Zero,不为人类的错误经验所羁绊,从最根本的围棋规则出发(可以理解为围棋世界的物理定律),形成自己对围棋的理解,最终全面战胜人类,以及被人类思想所束缚的老版 AlphaGo (当然,所谓 “对围棋的理解” 这是拟人的说法)。
#血肉之躯的陷阱#
Zero 暴露出了人类思维局限。但是因为它超越人类太多,所以人类棋手目前(或许永远?)无法理解到底局限在哪里。但是偶尔有我们能够看懂的,举个例子:人类棋手过度看重赢了多少,而不是赢棋的概率(overvalue margin of victory over probability of victory). 举个例子,如果下一步棋有 A、B 两种选择。选择 A 是 80% 的可能性赢 10目;而 B 是 99% 可能性赢 1目。人类棋手更倾向选择 A;而 AlphaGo 会选择 B。
选择 B 的逻辑并不奇怪,(甚至)人类也能理解:棋局最终只分胜负,至于胜 10目,还是胜 1目,并没有区别。To be fair, 人类并非不理解这个道理(甚至围棋谚语中也有 “赢棋不闹事” 的说法),但是人类并没有准确计算赢棋概率的能力,所以道理虽懂,但无法把握。所以只能退而求其次,用领先的目数来估测赢棋概率。这导致了很多误判。
略有伤感的是,即便我们明白了其中道理,这个思维误区是永远无法修复的。人类永远无法以 “血肉之躯” 的大脑来精确计算赢棋的概率。
#第一原则的胜利#
“血肉之躯” 一时无法改变,但是我们仍可以借鉴 Zero 的成长轨迹,从零开始考虑一个现象,摆脱前人错误经验的羁绊。英文对此有个形象的描述,叫 first principles,硬翻译过来,就是 “第一原则”,即最根本的,不容质疑的规律(往往是数学、物理等硬科学中,已经被千锤百炼,反复验证的规律)。
特斯拉创始人 Musk 就特别擅长运用[第一原则]。当年他决定做电动汽车;旁人觉得他疯了,因为 “地球人都知道”,电动汽车面临成本高,续航有限等等 “不可逾越” 的障碍。Musk 以他一贯的思维,从第一原则出发:电池的构成有哪些材料?这些材料的市场价如何?近几年价格走势如何?从这些最基本的信息,经过一番计算,他觉得电动汽车可行。现在证明,果然可行。这是第一原则的胜利。
祝大家 always remember to go back to first principles.
======
本文转自微信号:峰哥公号
扫码关注 fenggegonghao
![]() |
© 本文版权归 bymbrofeng 所有,任何形式转载请联系作者。
© 了解版权计划