破折号困境:AI连标点符号都控制不了,何谈超级智能?

0

近年来,破折号已成为许多人眼中AI生成文本的明显标志。这种标点符号在ChatGPT和其他AI聊天机器人的输出中频繁出现,有时甚至到了读者仅凭破折号的过度使用就能识别出AI写作的地步——尽管人类也会过度使用它。

周四晚上,OpenAI CEO萨姆·奥特曼在X上发帖称,ChatGPT已开始遵循自定义指令避免使用破折号。他写道:'小但快乐的胜利:如果你在自定义指令中告诉ChatGPT不要使用破折号,它终于会做它应该做的事!'

Sam Altman @sama Small-but-happy win: If you tell ChatGPT not to use em-dashes in your custom instructions, it finally does what it's supposed to do! 11:48 PM · Nov 13, 2025 · 2.4M Views

这条发布于OpenAI新GPT-5.1 AI模型发布两天后的帖子,收到了用户们的不同反应。多年来,许多用户一直努力让聊天机器人遵循特定的格式偏好,却屡屡受挫。这个'小胜利'引出了一个非常重要的问题:如果全球最有价值的AI公司在尝试多年后仍难以控制像标点符号使用这样简单的事情,那么人们所说的人工通用智能(AGI)可能比行业内某些人声称的要遥远得多。

一位X用户在回复中写道:'自ChatGPT首次发布已经三年了,你们现在才终于设法让它遵守这个简单的要求,这说明了你们对它的控制力有多小,以及对它内部工作原理的理解有多浅。这对未来来说不是好兆头。'

破折号的魅力:为何AI模型如此钟爱它

与键盘上有专门键位的短横线(-)不同,破折号(—)是一种长破折号,作家用它来插入补充信息、表示思路突然转变,或引入总结或解释。

Illustration of a man wrestling with a robot hand.

在AI语言模型出现之前,一些作家就经常哀叹现代写作中破折号的过度使用。在2011年Slate的一篇文章中,作家诺林·马隆认为作家用破折号'代替了正确构建句子',并且过度依赖它'阻碍了真正高效的写作'。ChatGPT发布前的各种Reddit帖子上,作家们要么在争论破折号使用的适当礼仪,要么承认频繁使用破折号是一种有罪的乐趣。

2021年,r/FanFiction subreddit的一位作家写道:'很长一段时间以来,我对破折号上瘾了。它们会出现在我写的每个段落中。我喜欢那条清晰的直线,它给了我一个将细节或想法塞入原本有序段落的借口。即使在经历了大约两年的写作障碍后重新开始写作,我仍然会尽可能多地塞入破折号。'

由于AI聊天机器人倾向于过度使用破折号,检测工具和人类读者已经学会将破折号使用视为一种模式,这给那些作品中自然偏爱这种标点符号的少数作家带来了问题。因此,一些记者抱怨说AI正在'杀死'破折号。

目前,没有人确切知道为什么大型语言模型(LLM)倾向于过度使用破折号。我们已经看到网上有各种推测试图解释这一现象,从注意到破折号在用作训练数据的19世纪书籍中更受欢迎(根据2018年的一项研究,英语中的破折号使用在1860年左右达到顶峰,然后在20世纪中叶逐渐下降),或者可能是AI模型从博客平台Medium上的自动破折号字符转换中借用了这个习惯。

我们可以确定的一件事是,LLM倾向于在训练数据(在初始训练过程中输入)和后续依赖人类偏好的强化学习过程中频繁输出的模式。因此,AI语言模型为您提供的是一种'平滑'的平均风格,无论您要求它们提供什么内容,都经过用户反馈调节。

所以最合理的解释仍然是,在互联网上大量示例训练的AI模型对专业风格写作的请求,会 heavily 倾向于训练数据中的主流风格,其中破折号在正式写作、新闻文章和编辑内容中频繁出现。也有可能在通过人类反馈(称为RLHF)进行训练期间,无论出于何种原因,包含破折号的响应获得了更高的评分。也许是因为这些输出在评估者看来显得更复杂或更有吸引力,但这只是推测。

从破折号到AGI:还有多远?

要理解奥特曼的'胜利'真正意味着什么,以及它对通向AGI的道路说明了什么,我们需要了解ChatGPT的自定义指令实际上是如何工作的。它们允许用户设置跨所有对话应用的持久偏好,通过在聊天开始前输入模型的提示中附加书面指令来实现。用户可以指定语调、格式和风格要求,而不需要在每次新聊天中手动重复这些请求。

然而,该功能并不总是可靠地工作,因为LLM并不总是可靠工作(即使是OpenAI和Anthropic也自由承认这一点)。LLM接收输入并产生输出,吐出提示(系统提示、自定义指令和您的聊天历史)的统计上合理的延续,它并不真正'理解'您的要求。对于AI语言模型的输出,总有一些运气成分才能让它们做您想做的事。

Illustration of a man wrestling with a robot hand.

在我们对GPT-5.1使用自定义指令的非正式测试中,ChatGPT确实遵循了我们不要生成破折号的请求。但尽管有奥特曼的声明,X用户的反馈显示,该功能的体验仍然各不相同,至少当请求未放在自定义指令中时是这样。

那么,如果LLM是统计文本生成器,'指令遵循'甚至意味着什么?这是解开从LLM到AGI假设路径的关键。对于LLM来说,遵循指令的概念从根本上不同于我们通常认为的人类具有通用智能时的指令遵循,甚至是传统计算机程序的指令遵循。

在传统计算中,指令遵循是确定性的。您告诉程序'不要包含字符X',它就不会包含该字符。程序完全按照编写的规则执行。对于LLM,'指令遵循'实际上是关于调整统计概率。当您告诉ChatGPT'不要使用破折号'时,您不是在创建硬性规则。您是在向提示添加文本,使与破折号相关的标记在生成过程中被选中的可能性降低。但'可能性降低'不等于'不可能'。

模型生成的每个标记都是从概率分布中选择的。您的自定义指令会影响该分布,但它与模型的训练数据(其中破折号在某些上下文中频繁出现)和提示中的所有其他内容相竞争。与带有条件逻辑的代码不同,没有单独的系统验证输出是否符合您的要求。指令只是影响统计预测过程的更多文本。

当奥特曼庆祝最终让GPT避免使用破折号时,他实际上是在庆祝OpenAI已经调整了最新版本的GPT-5.1(可能通过强化学习或微调),在其概率计算中更重视自定义指令。

这里有一个关于控制的讽刺:鉴于问题的概率性质,无法保证问题会一直得到解决。OpenAI在后台不断更新其模型,即使在同一版本号内,也会根据用户反馈和新训练运行调整输出。每次更新都会带来不同的输出特征,可能会撤销之前的行为调整,研究人员称之为'对齐税'。

精确调整神经网络的行为还不是一门精确的科学。由于网络中编码的所有概念都通过称为权重的值相互连接,调整一个行为可能会以意想不到的方式改变其他行为。今天修复破折号过度使用,明天的更新(旨在提高编码能力等)可能会无意中将它们带回来,不是因为OpenAI希望它们在那里,而是因为这是试图在数百万个相互竞争的影响下引导统计系统的本质。

这引出了我们前面提到的隐含问题。如果控制标点符号的使用仍然是一个可能随时重新出现的挣扎,那么我们离AGI还有多远?我们无法确定,但似乎越来越有可能它不会仅从大型语言模型中 emerge。因为AGI是一种复制人类通用学习能力的技术,可能需要真正的理解和自我反思的 intentional 行动,而不是有时恰好与指令一致的统计模式匹配。

AI控制的本质:表面胜利与深层局限

奥特曼的'破折号胜利'实际上揭示了AI控制的表面性。OpenAI能够通过调整模型参数使特定指令(如避免使用破折号)得到更好的遵循,但这并不意味着模型真正'理解'了指令的含义。它只是改变了概率分布,使某些标记(破折号符号)被选择的概率降低。

这种'控制'是脆弱的,因为它是基于概率而非规则。正如一位AI研究员指出的:'我们不是在编程机器,而是在训练概率分布。'这意味着每次模型更新都可能改变行为,即使意图保持不变。这就是为什么今天修复破折号问题,明天更新后可能再次出现的原因。

更深层次的问题是,这种表面控制与实现真正智能所需的能力之间存在巨大鸿沟。真正的智能不仅包括遵循指令,还包括理解指令背后的意图、适应新情境、进行创造性思考,以及拥有常识推理能力。这些能力远超当前AI系统的统计文本生成能力。

从标点符号到超级智能:不连贯的跳跃

奥特曼喜欢公开谈论AGI(一种在通用学习能力上等同于人类的假设技术)、超级智能(一种远超人类智能的模糊AI概念)和'天空中的神奇智能'(他指AI云计算?)同时为OpenAI筹集资金,但很明显,我们在地球上今天还没有真正可靠的人工智能。

这种从破折号控制到超级智能的跳跃是不连贯的。控制标点符号的使用与实现真正的理解、意识和智能之间存在根本区别。前者是关于调整统计概率,后者是关于创造能够理解世界、进行抽象思考并拥有自我意识的系统。

一些AI研究人员认为,当前的LLM只是'模式匹配机器',它们通过识别和复制训练数据中的模式来工作,而没有真正的理解或意识。如果这是真的,那么无论我们如何改进这些模型,它们可能永远无法达到真正的AGI。

未来之路:超越统计文本生成

要实现真正的AGI,可能需要超越当前LLM的统计文本生成方法。这可能包括:

  1. 神经符号系统:结合神经网络的模式识别能力和符号系统的逻辑推理能力。
  2. 具身智能:让AI通过与物理世界的互动来学习,而不仅仅是文本数据。
  3. 因果推理:教会AI理解因果关系,而不仅仅是相关性。
  4. 自我反思系统:开发能够评估自己推理和决策的AI系统。

这些方向中的每一个都代表了当前AI研究的重大挑战,可能需要数十年甚至更长时间才能实现。

结论:标点符号背后的深刻启示

奥特曼对破折号控制的庆祝,实际上揭示了AI发展中的一个深刻悖论:我们能够创造出在许多任务上超越人类的系统,却难以控制最基本的文本生成方面。这种不一致性表明,我们可能高估了当前AI技术的真正能力,同时低估了实现真正智能的难度。

破折号困境提醒我们,通往AGI的道路比许多人想象的要复杂和漫长。它不仅需要更大的模型和更多的计算能力,还需要根本性的理论突破和对智能本质的更深入理解。在庆祝'小胜利'的同时,我们也应该保持清醒的认识:真正的智能革命可能还在前方,而非眼前。