破折号困境:AI连标点符号都无法控制,AGI还有多远?

0

在过去的几年里,破折号(em dash)已成为许多人眼中AI生成文本的明显标志。这种标点符号频繁出现在ChatGPT和其他AI聊天机器人的输出中,有时甚至到了读者仅凭过度使用就能识别出AI写作的程度——尽管人类也会过度使用它。

周四晚上,OpenAI CEO萨姆·奥特曼在X平台上发帖称,ChatGPT已开始遵循自定义指令以避免使用破折号。他写道:'小小的但令人高兴的胜利:如果你在自定义指令中告诉ChatGPT不要使用破折号,它终于能按预期行事了!'

Sam Altman @sama Small-but-happy win: If you tell ChatGPT not to use em-dashes in your custom instructions, it finally does what it's supposed to do! 11:48 PM · Nov 13, 2025 · 2.4M Views

这张截图展示了萨姆·奥特曼关于破折号的X帖子。来源:X

这条帖子发布在OpenAI新GPT-5.1 AI模型发布两天后,收到了用户的混合反应。多年来,许多用户一直努力让聊天机器人遵循特定的格式偏好,却收效甚微。这个'小小的胜利'提出了一个非常大的问题:如果世界上最有价值的AI公司在多年尝试后,连控制标点符号使用这样简单的事情都感到困难,那么人们所说的人工通用智能(AGI)可能比行业某些人声称的要遥远得多。

一名X用户在回复中写道:'从ChatGPT首次发布到现在已经3年了,你们现在才设法让它遵守这个简单的要求,这充分说明你们对它的控制有多有限,以及对它内部工作原理的理解有多浅薄。这对未来来说不是好迹象。'

AI模型为何如此青睐破折号?

与键盘上专门键位的短横线(-)不同,破折号是一种长破折号,由特殊字符(—)表示,作者用它来插入补充信息、表示思路突然转变或引入总结或解释。

在AI语言模型出现之前,一些作家就经常哀叹现代写作中破折号的过度使用。在2011年Slate的一篇文章中,作家诺林·马隆认为,作家使用破折号'代替了恰当的句子构建',并且过度依赖它'阻碍了真正高效的写作'。ChatGPT发布前的各种Reddit帖子中,作家们要么在争论破折号使用的适当礼仪,要么承认他们频繁使用破折号是一种有罪的享受。

2021年,r/FanFiction版块的一名作家写道:'很长一段时间里,我对破折号上瘾了。它们会出现在我写的每个段落中。我喜欢那条清晰的直线,它给了我一个借口,可以将细节或想法塞入原本有序的段落中。即使在经历了两年的写作障碍后重新开始写作,我立即尽可能多地塞入破折号。'

由于AI聊天机器人倾向于过度使用破折号,检测工具和人类读者已经学会将破折号使用作为一种模式来识别,这给工作中自然偏爱这种标点符号的少数作家带来了问题。因此,一些记者抱怨说AI正在'杀死'破折号。

没有人确切知道为什么大型语言模型(LLM)倾向于过度使用破折号。我们已经看到网上有广泛的推测试图解释这一现象,从注意到19世纪书籍(用作训练数据)中破折号更受欢迎(根据2018年的一项研究,英语中的破折号使用在1860年左右达到顶峰,然后在20世纪中叶逐渐下降),到也许AI模型从博客网站Medium的自动破折号字符转换中养成了这个习惯。

我们确定的一点是,LLM倾向于在其训练数据(在初始训练过程中输入)和随后的强化学习过程中频繁输出常见模式,该过程通常依赖人类偏好。因此,AI语言模型为您提供了一种'平滑化'的平均风格,无论您要求它提供什么,都经过用户反馈产生的条件调节。

所以最合理的解释仍然是,在互联网海量示例上训练的AI模型对专业风格写作的请求,会强烈倾向于训练数据中的主流风格,其中破折号在正式写作、新闻文章和编辑内容中频繁出现。也有可能在通过人类反馈(称为RLHF)进行训练期间,无论出于何种原因,包含破折号的回应获得了更高的评分。也许是因为这些输出对评估者来说看起来更复杂或更有吸引力,但这只是推测。

从破折号到AGI?

要理解奥特曼的'胜利'真正意味着什么,以及它对通往AGI之路的启示,我们需要了解ChatGPT的自定义指令实际上是如何工作的。它们允许用户设置跨所有对话应用的持久偏好,方法是在聊天开始前输入模型时,将书面指令附加到提示中。用户可以指定语气、格式和风格要求,而不需要在每次新聊天中手动重复这些请求。

然而,该功能并非总是可靠地工作,因为LLM并不可靠工作(甚至OpenAI和Anthropic也坦然承认这一点)。LLM接收输入并产生输出,吐出提示(系统提示、自定义指令和您的聊天历史)的统计上合理的延续,它并不真正'理解'您的要求。对于AI语言模型的输出,要让它们做您想做的事情,总是需要一些运气。

在我们对GPT-5.1使用自定义指令的非正式测试中,ChatGPT确实遵循了我们不要生成破折号的请求。但尽管奥特曼声称如此,X用户的回应似乎表明,使用该功能的体验继续存在差异,至少当请求未放在自定义指令中时是这样。

所以,如果LLM是统计文本生成器,'指令遵循'甚至意味着什么?这是解开从LLM到AGI假设路径的关键。对于LLM来说,遵循指令的概念从根本上不同于我们通常认为的人类具有通用智能的指令遵循,甚至是传统计算机程序的指令遵循。

在传统计算中,指令遵循是确定性的。您告诉程序'不要包含字符X',它就不会包含该字符。程序完全按照编写的规则执行。对于LLM,'指令遵循'实际上是关于转移统计概率。当您告诉ChatGPT'不要使用破折号'时,您不是在创建硬性规则。您是在向提示添加文本,使与破折号相关的标记在生成过程中被选中的可能性降低。但'可能性降低'不等于'不可能'。

模型生成的每个标记都是从概率分布中选择的。您的自定义指令影响该分布,但它与模型的训练数据(其中破折号在特定上下文中频繁出现)和提示中的其他内容相竞争。与带有条件逻辑的代码不同,没有单独的系统根据您的要求验证输出。指令只是影响统计预测过程的更多文本。

当奥特曼庆祝终于让GPT避免使用破折号时,他实际上是在庆祝OpenAI已经调整了最新版本的GPT-5.1(可能通过强化学习或微调),在其概率计算中更重视自定义指令。

这里存在一种关于控制的讽刺:鉴于问题的概率性质,无法保证问题会保持固定。OpenAI在幕后不断更新其模型,即使在同一版本号内,也会根据用户反馈和新训练运行调整输出。每次更新都会带来不同的输出特性,可能会撤销之前的行为调整,研究人员称之为'对齐税'。

精确调整神经网络的行为还不是一门精确的科学。由于网络中编码的所有概念都称为权重的值相互连接,调整一种行为可能会以意外方式改变其他行为。今天修复破折号过度使用,明天的更新(旨在提高编码能力等能力)可能会无意中将它们带回来,不是因为OpenAI希望它们在那里,而是因为试图在数百万种竞争影响下引导统计系统的本质。

这引出了我们之前提到的一个隐含问题。如果控制标点符号使用仍然是一个可能随时重新出现的挑战,那么我们距离AGI还有多远?我们无法确定,但似乎越来越有可能它不会仅从大型语言模型中 emerge。因为AGI是一种复制人类通用学习能力的技术,它可能需要真正的理解和自我反思的 intentional 行动,而不是有时碰巧与指令一致的统计模式匹配。

超越标点符号:AI控制的深层挑战

破折号困境揭示了当前AI系统的一个根本性局限:它们缺乏对人类语言细微差别的真正理解。当用户请求不要使用破折号时,他们不仅仅是在请求一个特定的字符不被使用,而是在请求一种特定的写作风格和表达方式。这种请求背后是对语言美学、可读性和专业性的期望,而这些期望需要深层的语言理解能力。

AI模型面临的挑战远不止于标点符号。从遵循特定格式要求,到理解上下文中的隐含含义,再到生成符合特定受众期望的内容,这些任务都需要对人类交流方式的真正理解,而不仅仅是统计模式匹配。

Illustration of a man wrestling with a robot hand.

人类与AI系统之间的互动挑战。来源:Getty Images

行业乐观与现实的差距

萨姆·奥特曼等AI领导者经常公开谈论AGI、超级智能和'天空中的神奇智能',同时在为OpenAI筹集资金。这种乐观的叙事塑造了公众对AI发展速度的期望,但破折号这样的小问题提醒我们,现实与愿景之间仍存在巨大差距。

行业对AGI的时间表往往过于乐观,部分原因是商业利益和投资者期望。然而,像控制标点符号使用这样看似简单的挑战,却暴露了当前AI系统的根本局限性。如果连这样的基本语言控制都如此困难,那么实现真正的通用智能可能需要比许多人预期的更长时间。

通往真正智能的道路

破折号困境不仅仅是技术问题,它还迫使我们重新思考什么是真正的智能。真正的智能不仅仅是生成看似合理的文本,而是理解语言的细微差别,能够根据上下文调整表达,并且能够真正遵循复杂的人类指令。

要实现AGI,可能需要超越当前的统计语言模型范式。这可能需要结合符号推理、世界模型和真正的理解能力,而不仅仅是模式识别。破折号的小胜利提醒我们,即使是最先进的AI系统,也只是在表面层面上模仿人类智能,而没有真正理解它们所处理的含义。

结论:耐心与现实的期望

尽管萨姆·奥特曼庆祝ChatGPT终于能够遵循破折号使用规则是一个积极的信号,表明AI技术在不断进步,但我们不应将其误解为AGI即将到来的证明。控制标点符号使用这样的小问题,与实现真正的通用智能之间仍有天壤之别。

作为观察者和用户,我们需要对AI技术的发展保持耐心,同时保持现实的期望。AI系统正在快速进步,但它们仍然面临着理解人类语言和思维的深层挑战。破折号的小胜利值得庆祝,但它提醒我们,通往真正智能的道路仍然漫长而复杂。