AI自我进化：OpenAI如何用Codex重构编程工具的未来

在人工智能技术迅猛发展的今天，OpenAI正通过其AI编码助手Codex实现一种前所未有的自我迭代模式。这一创新不仅改变了软件开发的基本流程，更开创了AI系统自我进化的先河。本文将深入探讨OpenAI如何利用Codex构建和改进这一编程工具，分析其在实际应用中的成效，以及这一技术对整个软件开发行业的深远影响。

从工具到伙伴：Codex的进化历程

"Codex的大部分代码都是由Codex自己构建的，它几乎完全被用来改进自身。"OpenAI Codex产品负责人Alexander Embiricos在最近的一次采访中透露了这一令人惊讶的事实。这标志着AI编程工具已经从简单的代码生成器，进化为能够自我完善的智能编程助手。

Codex于2025年5月以研究预览形式推出，作为一个基于云的软件工程代理，能够处理编写功能、修复错误、提出拉取请求等任务。该工具在连接到用户代码库的沙盒环境中运行，可以并行执行多个任务。OpenAI通过ChatGPT的网页界面、命令行界面(CLI)以及VS Code、Cursor和Windsurf等IDE扩展提供Codex服务。

有趣的是，"Codex"这一名称可以追溯到2021年OpenAI基于GPT-3的一个模型，该模型为GitHub Copilot的标签补全功能提供支持。Embiricos表示，员工间流传这一名称可能是"code execution"的缩写。OpenAI希望将新的代理与这一早期时刻联系起来，尽管部分相关开发者已离开公司。

"对于许多人来说，为GitHub Copilot提供动力的模型是AI的第一次'哇'时刻，"Embiricos说道，"它向人们展示了当AI能够理解你的上下文和意图并加速你完成工作时可能带来的潜力。"

递归开发：AI构建AI的新范式

OpenAI的工程师们现在普遍使用Codex，他们使用与外部开发者可以自由下载、建议修改的相同开源版本的CLI。"我真的很喜欢我们团队的这一点，"Embiricos表示，"我们使用的Codex版本就是开源仓库本身，没有一个不同的仓库供功能进入。"

Codex开发的递归性质超越了简单的代码生成。Embiricos描述了Codex监控自身训练运行并处理用户反馈以"决定"下一步构建内容的场景。"我们有地方会要求Codex查看反馈然后决定做什么，"他说，"Codex正在为其自身的训练运行编写大量研究工具，我们正在尝试让Codex监控自己的训练运行。"

这种使用工具构建更好工具的递归循环在计算历史上有着深厚的根源。工程师在1960年代使用羊皮纸和纸手工设计了第一批集成电路，然后根据这些图纸制造了物理芯片。这些芯片为运行第一个电子设计自动化(EDA)软件的计算机提供动力，而EDA软件又使工程师能够设计出任何人都无法手动绘制的复杂电路。现代处理器包含数十亿晶体管，其排列模式仅因软件而存在。OpenAI使用Codex构建Codex似乎遵循同样的模式：每一代工具都创造出为下一代提供能力的基础。

AI编程助手界面展示

OpenAI的Codex在ChatGPT中的界面展示

"AI队友"：加速开发的新模式

根据OpenAI的内部数据，Codex对其开发的最戏剧性影响体现在Sora Android应用的开发上。据Embiricos介绍，该开发工具使公司能够在创纪录的时间内创建应用。

"Sora Android应用由四名工程师从零开始构建，"Embiricos告诉Ars，"用了18天时间完成构建，然后我们在28天内将其发布到应用商店。"工程师们已有iOS应用和服务器端组件可以参考，因此他们专注于构建Android客户端。他们使用Codex帮助规划架构，为不同组件生成子计划，并实现这些组件。

Ed Bayes是Codex团队的一名设计师，他描述了该工具如何改变了自己的工作流程。Bayes表示，Codex现在与Linear等项目管理工具和Slack等通信平台集成，允许团队成员直接向AI代理分配编码任务。"你可以添加Codex，基本上可以向它分配问题，"Bayes告诉Ars，"Codex literally是你工作空间中的队友。"

这种集成意味着当有人在Slack频道发布反馈时，他们可以标记Codex并要求它修复问题。该代理将创建拉取请求，团队成员可以通过同一线程审查和迭代更改。"它基本上是在模拟这种同事，并出现在你工作的任何地方，"Bayes说。

对于Bayes来说，他负责Codex界面的视觉设计和交互模式，该工具使他能够直接贡献代码，而不是将规范交给工程师。"它给了你更多杠杆。它使你能够跨栈工作，基本上能够做更多事情，"他说。他指出，OpenAI的设计师现在通过直接构建功能来原型化功能，使用Codex处理实现细节。

人类与AI的协作新模式

OpenAI的方法将Codex视为Bayes所说的"初级开发人员"，公司希望它随着时间的推移能成长为高级开发人员。"如果你要入职一名初级开发人员，你会如何入职？你给他们一个Slack账户，给他们一个Linear账户，"Bayes说，"它不仅仅是你可以在终端中使用的工具，它也是来找你并坐在你团队中的东西。"

当被问及这种队友方法是否会让人类无事可做时，Embiricos区分了"氛围编码"和"氛围工程"。"我们在代码库中看到了更多的氛围工程，"他说，"你让Codex处理那个，甚至可能先要求一个计划。来回讨论，迭代计划，然后你就与模型保持联系并仔细审查其代码。"

他补充说，氛围编码在原型和一次性工具中仍有其位置。"我认为氛围编码很棒，"他说，"现在你作为人类可以决定你想在代码上投入多少注意力。"

命令行版本的OpenAI Codex在macOS终端窗口中运行

命令行版本的OpenAI Codex在macOS终端窗口中运行

前景展望：AI编程助手的发展方向

过去一年，像GPT-4.5这样的"单体"大型语言模型在前沿基准测试进展方面似乎已成为某种死胡同，因为AI公司转向模拟推理模型以及由多个并行运行的AI模型构建的代理系统。我们询问Embiricos像Codex这样的代理是否代表了从现有LLM技术中挤出效用的最佳路径。

他 dismiss了对AI能力已趋于平缓的担忧。"我认为我们离平缓还很远，"他说，"如果你看看我们研究团队的速度，我们几乎每周或每隔一周就发布模型。"他指出最近的改进，据报道GPT-5-Codex在相同智能水平下比其前身完成任务速度快30%。在测试中，该公司已看到模型在复杂任务上独立工作24小时。

OpenAI在AI编码市场面临来自多个方向的竞争。Anthropic的Claude Code和Google的Gemini CLI提供类似的基于终端的代理编码体验。本周，Mistral AI发布了Devstral 2和一个名为Mistral Vibe的CLI工具。与此同时，像Cursor这样的初创公司已经围绕AI编码构建了专用的IDE，据报道年化收入已达3亿美元。

客观看待AI编码工具的挑战

鉴于AI模型在人们尝试将其用作事实资源时众所周知的[编造]问题，编码是否已成为LLM的杀手级应用？我们想知道OpenAI是否注意到，与使用AI语言模型进行写作或作为情感伴侣相比，编码似乎是当今AI模型的一个明确业务用例，危险性较小。

"我们绝对注意到编码是代理将很快变得非常好的地方，并且有很大的经济价值，"Embiricos说，"我们认为专注于Codex与我们的使命非常一致。我们能够为开发者提供很多价值。此外，开发者为其他人构建东西，所以我们通过他们内在地扩展。"

但像Codex这样的工具是否会威胁软件开发人员的工作？Bayes承认存在担忧，但表示Codex并未减少OpenAI的人员编制，"总是有人类在循环中，因为人类实际上可以阅读代码。"同样，两人不预测Codex将在没有任何形式的人类监督的情况下自行运行的未来。他们认为该工具是人类潜力的放大器，而不是替代品。

Embiricos表示，公司的长期愿景是使编码代理对没有编程经验的人有用。"所有人不会打开IDE甚至知道终端是什么，"他说，"我们现在正在构建一个仅面向软件工程师的编码代理，但我们认为我们构建的形状实际上将是一种更通用的代理，对人们更有用。"

结语：AI编程助手的新时代

OpenAI使用Codex构建Codex的方法代表了软件开发范式的一次重大转变。这不仅提高了开发效率，还开创了AI系统自我进化的先河。随着技术的不断进步，我们有理由相信，未来的AI编程助手将变得更加智能、更加自主，同时也更加注重与人类开发者的协作。

在这个由AI和人类共同构建的编程新时代，我们看到的不是替代，而是增强；不是竞争，而是协作。正如OpenAI所展示的那样，真正的未来不在于AI取代人类，而在于AI如何帮助人类释放更大的创造力和生产力潜力。