告别“聊天”模式:O1 模型的新身份与正确打开方式

86

最近,一篇名为《o1 isn’t a chat model(and that’s the point)》的文章在AI圈内引发热议,OpenAI CEO Sam Altman和总裁Greg Brockman也纷纷围观。文章的核心观点直指:别再把O1模型当成聊天机器人了! 这究竟是怎么回事?O1模型又该如何正确使用呢?

O1:从“聊天”到“报告”的身份转变

从“聊天”到“报告”的身份转变

一直以来,我们习惯性地将AI模型视为聊天助手,期待它们能像人类一样自然流畅地对话,解决各种问题。然而,O1模型的出现,打破了这一固有认知。它更像是一个强大的“报告生成器”,而非“聊天机器人”。

为什么会有这样的转变?原因在于O1模型的设计理念与传统聊天模型存在根本差异。传统聊天模型通过多轮对话来逐步获取上下文信息,而O1模型则需要我们一次性提供尽可能多的上下文,才能发挥其最大效能。

“提示”不再是关键,“Brief”才是王道

如果你习惯使用ChatGPT等聊天模型,可能会觉得O1模型有点“笨”。当你向它提出一个简单的问题时,它可能会给你一大堆自相矛盾的答案,外加一些你并不需要的架构图和优缺点列表。这并不是O1模型本身的问题,而是我们没有采用正确的“打开方式”。

O1模型需要的是详细的Brief,而不是简单的Prompt。简而言之,我们需要像对待一位新入职的员工一样对待O1模型,详细说明所有背景信息,例如:

  • 详细说明你尝试过但没有奏效的方法。
  • 添加所有数据库架构的完整dump。
  • 解释你公司的业务、规模,并定义公司特有的术语。

从“如何做”到“做什么”

从“如何做”到“做什么”

传统上,我们习惯告诉模型“如何做”,例如:“你是一位专家级软件工程师,请仔细思考并逐步分析问题。” 但在O1模型中,我们需要将重点放在“做什么”,即准确地描述你想要的结果,让O1模型自主规划和解决问题的步骤。

这种“自主推理”的模式,实际上比人工审查和聊天要快得多。因为它允许模型根据其庞大的知识库和强大的计算能力,快速找到最优解决方案。

O1模型的优势与局限

当然,O1模型并非完美无缺,它也有自己的长处和短板。

O1擅长:

  • **完美处理整个/多个文件:**O1模型可以一次性处理大量代码或文本,并遵循现有模式代码库,极少出错。
  • **减少幻觉:**O1模型在处理特定查询语言时,能更准确地理解语法,减少错误输出。
  • **医疗诊断:**O1模型在医疗诊断方面表现出色,能提供准确的鉴别诊断。
  • **解释概念:**O1模型能通过示例解释复杂的工程概念。
  • **架构决策:**O1模型可以生成多个方案,并进行比较分析。
  • **评估:**O1模型在评估生成结果的正确性方面表现出巨大潜力。

O1的局限:

  • **特定风格写作:**O1模型不擅长以特定声音或风格进行写作,它更倾向于学术/企业报告风格。
  • **构建整个应用:**O1模型适合一次性构建单个文件,但不适合构建整个SaaS应用。

O1的未来:高延迟、长时间运行的智能

O1模型的出现,预示着AI应用的新趋势:高延迟、长时间运行的智能。这使得某些以前不可能实现的产品成为可能。例如,用户可以提交复杂的任务,等待几分钟、几小时甚至几天,以获得更精准、更全面的解决方案。

总结

O1模型不是聊天机器人,而是一个强大的“报告生成器”。它需要详细的上下文和明确的目标,才能发挥其最大效能。理解O1模型的特点,掌握其正确的使用方式,将有助于我们更好地利用AI的力量,开启AI应用的新篇章。