哪个AI更好?
故事时间
先说个有的没的的故事。请勿对号入座。
读书时候,C同学是个努力的学霸,却没什么小聪明。学习刻苦,从零开始,一步一个脚印,整理笔记,考研上岸。D同学比他多点小聪明,借了他的笔记,物尽其用,虽不曾照搬,但也算站在C巨人的肩膀上,一点没绕弯路,也上岸了。故事说到这里到底尚未谁对谁错。
还没完。
后来C同学和D同学都开始卖考研课程。D很努力,卷生卷死,举一反三,甚至有些知识点的处理方式还超过了C,但无论如何不曾从头学习,是借了C的笔记速成的,卖课还比C卖得便宜,抢了C好多客户,C自然是不高兴的。
虽然C和D天天扯头发论输赢对错,可这不是我的事儿。我要是真的站队了,被扯掉头发的就该是我了。
故事归故事,听过算了也好,对号入座也好,是你们看日记的人的事儿。
我其实要回答的是之前日记下的一个问题:你喜欢ChatGPT还是DeepSeek?我一直没有回答,是因为即使此刻都没有明确的答案,好像你问我喜欢洗衣机还是洗碗机。
横向比较
但我总算是有些零星的想法。
上周,我和博士期间的一位很好的朋友聊起 AI 发展对数学家工作的影响(这位教授朋友受我邀请,马上要做一个AI对数学家的影响的在线报告,如果大家有兴趣我可以贴一个链接)。意犹未尽,出于好奇,分别向 ChatGPT-4o 和 DeepSeek-R1 提出了一个简单的问题:证明或证伪“任意两个偶数的和总是能被 4 整除”。
这里插播一下,我为什么比较ChatGPT-4o和DeepSeek-R1而不是其他版本的模型。你当然可以比较两家公司其他版本的模型。我的理由是:它们发布的时间相近,参数基本在同一规模。另外,二者都是大型语言模型LLM+聊天机器人的形式,目标用户相似,使用场景高度重合。二者都能回答问题、处理一般文本需求、编写代码,甚至算数学题(然而我还是能出把它俩都放倒的问题),在日常使用体验上具备可比性。至于为什么不用OpenAI o1,哦,那是因为,哦咦哦咦太贵啦,比大学生还贵。
回到之前的简单数学题。ChatGPT-4o 的解答从复述问题开始,接着用符号表达基本概念,但在推理过程中思路不够清晰,甚至未能给出明确的结论。很像我教过的本科生,考试抄了题目还追着我给1分。而 DeepSeek-R1 则直接给出了一个反例,并通过模运算清晰推导,最终得出结论。
当然,这只是一个很简单的数学问题,难以仅凭一例就判优劣。从根本上讲,二者在开发时候的侧重点和发布的卖点本就不同:
DeepSeek-R1 主要侧重于推理能力,通过一种叫做“思维链”(Chain of Thought, CoT)的方思维模式进行推理,将复杂问题拆解为更小、更易处理的步骤。这种方式与我们在解决数学问题时的思维模式十分相似。ChatGPT-4o 主要侧重于多模态交互(multimodel),强调用一个模型同时处理文本、图像、音频等多种输入的能力,创造更自然的交流体验。
既然核心能力不同,就很难给出一个简单的“我更喜欢谁”的答案。
Distillation:模型蒸馏
我在以前的日记中多次提到过,以ChatGPT为代表的大型语言模型能够达到今天的高度,得益于2017年提出的一个模型结构:Transformer,从而最大程度模拟了人脑处理自然语言的方式。
假设有一句话:“夏老师在菜里放了一勺豆瓣酱。”谁放了豆瓣酱?夏老师,一勺还是菜?这个问题,对于你而言轻而易举,但对计算机来说,在2017年前都是一个极为困难的任务。而Transformer的核心部分attention(自注意力),就量化了每一个单词(准确来讲,应该是token,即是语言模型处理文本时的最小单位。它可以是一个完整的单词、一部分单词或者一个标点符号)应该对上下文的注意力。比如说豆瓣酱对夏老师的注意力是0.6,对菜的注意力是0.3等。
另外一个英文上的例子是,之前的语言模型甚至难以处理“The cat run"还是“The cat runs"这样主谓一致的简单问题,但对于Transformer来讲完全不是问题。——如果有人感兴趣,我之后也可以单独讲一讲技术上的细节。
模型的精妙设计和海量数据固然是成功的关键,但强大的计算力则是实现这些设计和数据潜力的必要手段。DeepSeek 能够在相对有限的预算下达到今天的表现,除了我们之前提到的强化学习(RL)外,还有赖于一种叫做 模型蒸馏(Distillation) 的技术。
模型蒸馏,顾名思义,就是一个取其精华的过程。它的核心思想是,我们可以一个规模较小的“学生模型”,它脱胎于一个规模庞大但性能优异的“教师模型”,减小模型体积和计算资源,却保留了教师模型大致的准确性。
ChatGPT还是DeepSeek?
从使用者的角度来说,我会用中西方语言和思维方式的不同去类比两个模型的不同。当然,AI 的发展本质上是对人类思维的一种复制和模拟,所以不同文化背景下形成的思维模式,自然能从人工智能的交流方式中窥见一斑。
我成长的文化注重思维的严谨,强调有理有据,一步一步推演的思维方式;而西方教育更多倾向于培养高效的表达方式,同时也强调跨各种不同领域的能力。这种文化差异直接体现在语言表达上,也自然映射到人工智能的设计理念上。
ChatGPT 多模态交互能力的特性似乎正符合了西方文化中强调的“通才”跨领域理念。上文说过, 它能够同时处理文本、图像和音频等不同的输入,给出统一和直接的回答。这种设计使得它在跨领域任务、实时对话中表现出色比DeepSeek出色,但通才并不特精于某一个领域。
而DeepSeek 的设计更侧重于严谨的逻辑推理能力,正如东方文化中你我的一贯的思考方式。它在处理复杂问题时,会确保每一步都不出错。这种方法别适用于需要深入推理和细致分析的任务,当然有时候也会稍显事故和油腻。
对于用户而言,不同的应用场景会得出完全不同的结论。从当前的发展水平来看,我可以这样概括:
如果你的需要严谨的逻辑推理(比如数学竞赛题或复杂推理问题),DeepSeek-R1 可能是更好的选择。如果你需要多模态交互,或者处理涉及不同语言形式的任务,ChatGPT-4o 更具优势。
所以,这并不是一个二选一的问题,而是取决于你真正的需求。成人年不做选择,我两个都骂。何况,一般我要处理的这种难度的数学问题,两个模型都处理不了。 AI系列暂时更新到这里。
-
柳夏 赞了这篇日记 2025-04-26 16:47:09
-
lotusea 赞了这篇日记 2025-03-29 17:02:41
-
老张 赞了这篇日记 2025-03-17 08:18:51
-
缘木 赞了这篇日记 2025-03-07 22:45:06
-
想回比萨躺草坪 赞了这篇日记 2025-03-07 20:49:14
-
塔希 赞了这篇日记 2025-03-07 00:05:53
-
佯谬 赞了这篇日记 2025-03-06 22:06:54
-
亞熱帶 赞了这篇日记 2025-03-06 18:30:53
-
人设是白富美 赞了这篇日记 2025-03-06 18:02:48
-
momo 赞了这篇日记 2025-03-06 10:08:41
-
永远好奇热爱 赞了这篇日记 2025-03-06 10:02:00
-
水姑娘 赞了这篇日记 2025-03-05 23:43:18
-
momo 赞了这篇日记 2025-03-05 22:42:40
-
Jie Joel 赞了这篇日记 2025-03-05 22:15:07
-
段姝颀 赞了这篇日记 2025-03-05 21:06:18
-
ジェラトーニ 赞了这篇日记 2025-03-05 20:57:01
-
destiny 赞了这篇日记 2025-03-05 19:25:31
-
勾线面条 赞了这篇日记 2025-03-05 19:24:34
-
豆友XA-p2OZm0c 赞了这篇日记 2025-03-05 17:51:25
-
莲藕排骨汤 赞了这篇日记 2025-03-05 17:00:24
-
狐尾草 赞了这篇日记 2025-03-05 16:33:14
-
🐶 赞了这篇日记 2025-03-05 16:08:44
-
早睡早起写论文 赞了这篇日记 2025-03-05 14:30:56
-
踉踉跄跄 赞了这篇日记 2025-03-05 14:23:16
-
琬琰 赞了这篇日记 2025-03-05 13:19:32
-
遇见TOTORO 赞了这篇日记 2025-03-05 13:08:20
-
边儿去 赞了这篇日记 2025-03-05 12:27:19
-
白小天 赞了这篇日记 2025-03-05 11:39:33
-
Univek 赞了这篇日记 2025-03-05 11:30:54
-
澜伊 赞了这篇日记 2025-03-05 11:24:42
-
安娜苏 赞了这篇日记 2025-03-05 11:16:37
-
懒加菲 赞了这篇日记 2025-03-05 11:14:03
-
离歌轻唱 赞了这篇日记 2025-03-05 10:58:01
-
罐头 赞了这篇日记 2025-03-05 10:34:16
-
沐浴 赞了这篇日记 2025-03-05 10:28:48
-
看不清换一个 赞了这篇日记 2025-03-05 10:10:36
-
Windiswild 赞了这篇日记 2025-03-05 09:20:56
-
熹微 赞了这篇日记 2025-03-05 08:46:16
-
漫游者 赞了这篇日记 2025-03-05 08:40:19
-
隔江山色 赞了这篇日记 2025-03-05 08:18:48
-
plumlee 赞了这篇日记 2025-03-05 08:14:21
-
Y的树洞 赞了这篇日记 2025-03-05 08:01:08
-
「言晴」 赞了这篇日记 2025-03-05 07:59:32
-
蔓延到何方 赞了这篇日记 2025-03-05 07:57:19
-
Irshan9000 赞了这篇日记 2025-03-05 07:24:32
-
FlareGloria 赞了这篇日记 2025-03-05 07:24:01
-
豆友252736024 赞了这篇日记 2025-03-05 07:23:00
-
浅葱 赞了这篇日记 2025-03-05 07:16:41
-
小当的豆沙粽子 赞了这篇日记 2025-03-05 07:05:47
-
老愚 赞了这篇日记 2025-03-05 06:53:58
-
阳光灿烂 赞了这篇日记 2025-03-05 06:53:04
-
南天一苇 赞了这篇日记 2025-03-05 06:32:00
-
铃铛, 赞了这篇日记 2025-03-05 06:26:27
-
John13577 赞了这篇日记 2025-03-05 05:36:35
-
timelessclock 赞了这篇日记 2025-03-05 05:35:25
-
蔓星人 赞了这篇日记 2025-03-05 05:32:40
-
纯心走天涯 赞了这篇日记 2025-03-05 03:32:53
-
何麒遼 赞了这篇日记 2025-03-05 03:15:58
-
Pooki 赞了这篇日记 2025-03-05 02:32:52
-
宫商徴 赞了这篇日记 2025-03-05 01:41:04
-
低**人口 赞了这篇日记 2025-03-05 01:30:52
-
mono 赞了这篇日记 2025-03-05 00:45:39
-
唐樾 赞了这篇日记 2025-03-05 00:33:12
-
月某 赞了这篇日记 2025-03-05 00:30:22
-
Crissty 赞了这篇日记 2025-03-05 00:28:43
Charlotte的最新日记 · · · · · · ( 全部 )
- 回家吃顿春天饭 (141人喜欢)
- AI,数学家和三体问题 (48人喜欢)
- 穿衣摆烂 (97人喜欢)
- 数学,语言,大语言模型 (448人喜欢)
- 写作这件大事 (159人喜欢)
热门话题 · · · · · · ( 去话题广场 )
-
加载中...