语病
文字是武器,是刀剑。 项羽当年在和我差不多年龄的时候,愤怒地丢下刀剑,说:剑术这种不过杀一人的本事耳,我要学习万人敌的本领! 倘若把他所处的年份加上2000年,那么他将和鲁迅一样丢下手中的刀去捡起笔。 兵者,国之大事死生之地存亡之道不可不察也。 我们必须仔细审视手中的文字,因为它们就是有如此宏伟的力量。 或者对于我来说,文字就是具有宏伟地改变我的力量,这让我对最近的大语言模型十分无力。即使它输出文字中隐含的语义在多数情况下似是而非,但是它们编织出来的语法却无懈可击,能够将似是而非的腐蚀性思想隐藏在工整的格式和语法结构下令人难以拒绝...而这脱胎于几百年来无数精通于文法的良好数据集,正如接受了数年良好的文法练习的神学院修士。 我们并非在讨论自然语言处理和语言模型这种话题,虽然我对它们的理解不应低于任何计算机科学与技术系的研究生...浸润在较为古典的文学中十数年来,我可能是在这方面上会自诩“古典派”吧。在网络上应用互联网meme和烂梗总会让我不自觉地心跳加速,仿佛这是不被允许的,而这通常也暗示着打破禁忌的悖德快感——尽管这并不代表我并非深谙此道——而我通常会避免在任何超过三行的文字中应用它们,以避免它们蕴含的丰富语义冲破我搭建好的脆弱的语法结构。 说回到语病上。这是我们今天要讨论的主要话题。我对这东西的过敏程度大概也是很高的。阅读充斥着语法错误和拼写错误的一段文字总令我如鲠在喉。尤其是能够在看出作者并没有接受过任何文法教育而蕴含其中的大量情感又喷涌而出之时。这时我们将又一次地痛恨人与人之间交流居然只能以如此低效率的方式进行!思考并非是自然语言形式的,而是电信号在以光速传播的形式,而显然这一形式比Bert和GPT要高级许多...忘了它们吧,我现在必须的处理的CLIP工作也并没有比它们高明多少。 但这并不代表着我自己并不会犯语法错误。恰恰相反,我注意到自己生涩的表达方式和跳跃式的思考习惯往往会催生大量的长难句,而这就是语病所潜藏的地方。我所痛恨的语法错误正实现在我的笔下,这令我厌恶自己的笔锋。 而这也隐喻着某种处世之道。还记得我们最开始抛出的楔子吗?文字是刀剑。我看到许多并不规范,并不整洁的语病滋生在我周遭的环境里。就连桌子上书本摆放的倒装都令我心神不宁。这恐怕是我许多压力的来源。说出去谁信呢。 而这同时也映射在我自身上。我理想中的生活应当是早上如同时钟一般起床并且精力充沛的,而近三年来我的起床时间已经从10点为μ而且α很大地形成着正态分布...这令我某种意义上hate myself.但是无论如何我应当接受这一点,反倒是大语言模型向我证明了这一点:即使是没有语病,这文字依然可能是有害的,无意义的。这令我脱离语法这层无意义的形式,转而投身进入冷冰冰的而且熵值无论如何都在增加的现实之中,这令我充满了决心。