在AI编程工具日益受到软件开发者欢迎的背景下,这些工具的应用已开始触及开发过程的各个方面,包括AI编程工具本身的改进。本周,OpenAI员工在接受Ars Technica采访时透露,公司现在在多大程度上依赖其AI编程助手Codex来构建和改进这一开发工具。
"我认为Codex的大部分代码实际上是由Codex自身构建的,所以它几乎完全被用来改进自身,"OpenAI Codex产品负责人Alexander Embiricos在周二的一次对话中表示。
Codex:从研究工具到自我进化的编程助手
Codex是OpenAI在2025年5月以研究预览形式推出的现代版本,作为一个云端软件工程代理运行,能够处理编写功能、修复错误和提出拉取请求等任务。该工具运行在与用户代码库链接的沙盒环境中,可以并行执行多个任务。OpenAI通过ChatGPT的网页界面、命令行界面(CLI)以及VS Code、Cursor和Windsurf的IDE扩展提供Codex。
"Codex"这个名字本身可以追溯到OpenAI基于GPT-3的2021年模型,该模型为GitHub Copilot的标签补全功能提供支持。Embiricos表示,员工间流传着这个名称是"code execution"的缩写。OpenAI希望将新代理与这一早期时刻联系起来,而这一时刻的部分设计者已经离开了公司。
"对许多人来说,为GitHub Copilot提供动力的模型是AI的第一个'哇'时刻,"Embiricos说。"它向人们展示了当AI能够理解你的上下文和你想要做的事情并加速完成时可能意味着什么。"
自我进化的编程循环
OpenAI使用Codex开发Codex的方式并非简单代码生成,而是形成了一个复杂的自我进化循环。Embiricos描述了Codex监控自身训练运行并处理用户反馈以"决定"下一步构建内容的场景。
"我们有地方会让Codex查看反馈然后决定做什么,"他说。"Codex正在为其自身的训练运行编写大量研究工具,我们正在尝试让Codex监控其自身的训练运行。"OpenAI员工还可以通过Linear等项目管理工具向Codex提交工单,像对待人类同事一样为其分配任务。
这种使用工具构建更好工具的递归循环在计算历史中有着深厚的根源。工程师在1960年代用手在羊皮纸和纸上设计了第一批集成电路,然后根据这些图纸制造了物理芯片。这些芯片驱动了运行第一个电子设计自动化(EDA)软件的计算机,而EDA软件又使工程师能够设计出任何人都无法手动绘制的复杂电路。现代处理器包含数十亿晶体管,其排列模式只因为软件才成为可能。OpenAI使用Codex构建Codex似乎遵循同样的模式:每一代工具都创造出为下一代提供支持的能力。
"AI队友":加速开发的新模式
根据采访,Codex内部影响最显著的例子来自OpenAI开发Sora Android应用的过程。据Embiricos介绍,该开发工具使公司能够以创纪录的时间创建应用。
"Sora Android应用由四名工程师从零开始构建,"Embiricos告诉Ars。"用了18天时间构建,然后我们在28天内将其发布到应用商店,"他说。工程师已有iOS应用和服务器端组件可以参考,因此他们专注于构建Android客户端。他们使用Codex帮助规划架构,为不同组件生成子计划,并实现这些组件。
尽管OpenAI声称在内部使用Codex取得了成功,但值得注意的是,独立研究表明AI编程生产力效果不一。METR在7月发表的一项研究发现,在复杂成熟的代码库上使用AI工具时,经验丰富的开源开发者实际上慢了19%——尽管研究人员指出AI在更简单的项目上可能表现更好。
Codex团队的设计师Ed Bayes描述了该工具如何改变了他自己的工作流程。Bayes表示,Codex现在与Linear等项目管理工具和Slack等通信平台集成,允许团队成员直接向AI代理分配编码任务。
"你可以添加Codex,基本上现在可以向Codex分配问题,"Bayes告诉Ars。"Codex实际上就是你工作空间中的一个队友。"
这种集成意味着当有人在Slack频道发布反馈时,他们可以标记Codex并要求它修复问题。代理将创建拉取请求,团队成员可以通过同一线程审查和迭代更改。
"它基本上是在模拟这种同事,并出现在你工作的任何地方,"Bayes说。
对于负责Codex界面视觉设计和交互模式的Bayes来说,该工具使他能够直接贡献代码,而不是将规范交给工程师。
"它给了你更多杠杆。它使你能够跨栈工作,基本上能够做更多事情,"他说。他指出,OpenAI的设计师现在通过直接构建功能来原型化,使用Codex处理实现细节。
人类开发者的角色转变
OpenAI的方法是将Codex视为Bayes所说的"初级开发者",公司希望它随着时间的推移能成长为高级开发者。
"如果你要入职一名初级开发者,你会如何入职他们?你给他们一个Slack账户,给他们一个Linear账户,"Bayes说。"它不仅仅是你去终端使用的工具,它也会来找你,并坐在你的团队中。"
在这种队友模式下,人类还有什么事可做?当被问及时,Embiricos区分了"氛围编码"和"氛围工程"。前者是开发者接受AI生成的代码而不进行密切审查,后者是AI研究员Simon Willison提出的概念,指人类保持参与循环。
"在我们的代码库中,我们看到更多的是氛围工程,"他说。"你让Codex处理那个,甚至可能先要求一个计划。来回迭代计划,然后你就与模型保持循环并仔细审查其代码。"
他补充说,氛围编码在原型和一次性工具中仍有其位置。
"我认为氛围编码很棒,"他说。"现在你作为人类可以决定你想在代码上投入多少注意力。"
竞争与未来展望
过去一年,像GPT-4.5这样的"单体"大型语言模型在前沿基准测试进展方面似乎已成为某种死胡同,因为AI公司转向模拟推理模型和由多个并行运行的AI模型构建的代理系统。我们询问Embiricos像Codex这样的代理是否代表了从现有LLM技术中挤出效用的最佳路径。
他驳斥了AI能力已达到高原的担忧。 "我认为我们离高原还很远,"他说。"如果你看看我们研究团队的速度,我们几乎每周或每隔一周都在发布模型。"他指出最近改进,据报道GPT-5-Codex在相同智能水平下完成任务速度比前代快30%。在测试期间,公司已看到该模型能够独立处理复杂任务24小时。
OpenAI在AI编程市场面临来自多个方向的竞争。Anthropic的Claude Code和Google的Gemini CLI提供类似的基于终端的代理编码体验。本周,Mistral AI发布了Devstral 2和名为Mistral Vibe的CLI工具。与此同时,像Cursor这样的初创公司已围绕AI编码构建了专用IDE,据报道年收入达3亿美元。
鉴于众所周知的问题,包括AI模型在人们尝试将其用作事实资源时的幻觉问题,编码是否已成为LLMs的杀手级应用?我们想知道OpenAI是否注意到,与使用AI语言模型进行写作或作为情感伴侣相比,编码似乎是当今AI模型明确的商业用例,且危害较小。
"我们绝对注意到编码既是代理将快速变得擅长的地方,也有巨大的经济价值,"Embiricos说。"我们认为专注于Codex与我们的使命非常一致。我们能够为开发者提供很多价值。此外,开发者为其他人构建东西,所以我们某种程度上通过他们内在地扩展了影响。"
但像Codex这样的工具会威胁软件开发者的工作吗?Bayes承认存在担忧,但表示Codex并未减少OpenAI的人员数量,"总有人参与循环,因为人实际上可以阅读代码。"同样,这两个人不认为未来会出现某种形式的人类监督下Codex自行运行的情况。他们认为该工具是人类潜力的放大器,而非替代品。
像Codex这样的代理的实际影响超出了OpenAI的范围。Embiricos表示,公司的长期愿景是使编码代理对没有编程经验的人有用。 "全人类不会都打开IDE甚至知道终端是什么,"他说。"我们现在正在构建一个专为软件工程师设计的编码代理,但我们认为我们构建的形态实际上将成为更通用代理的有用之物。"
技术挑战与伦理思考
尽管AI编程助手展现出巨大潜力,但它们仍面临诸多技术挑战。首先是代码准确性问题。研究表明,在复杂成熟的代码库上使用AI工具时,经验丰富的开发者实际上可能变慢19%。这表明AI在处理复杂代码时可能不如人类开发者可靠。
其次,AI编程助手面临"幻觉"问题——即生成看似合理但不正确的代码。这可能导致安全漏洞或功能故障,特别是在关键任务应用中。
此外,AI编程工具还引发了关于知识产权和代码归属的伦理问题。当AI助手生成代码时,谁拥有这些代码的版权?这需要法律界和技术界共同探索解决方案。
编程范式的转变
AI编程助手的出现不仅仅是工具的升级,更是编程范式的根本转变。传统上,编程需要深厚的专业知识和丰富的经验,而AI助手正在降低这一门槛,使更多人能够参与软件开发过程。
OpenAI的愿景是,未来编码代理将不仅服务于专业开发者,还将扩展到没有编程经验的人群。这种转变可能会重塑整个软件生态系统,创造更多可能性。
同时,这也意味着开发者角色的转变。未来的开发者可能更专注于创意设计、系统架构和问题解决,而将具体的代码实现交给AI助手。这种分工将使人类能够专注于更高层次的创造性工作。
结论:人机协作的新时代
OpenAI使用Codex构建Codex的做法代表了AI技术发展的一个重要里程碑——不仅使用AI改进特定应用,而是让AI参与自身的进化过程。这种自我改进的循环可能加速AI技术的发展,创造更强大、更智能的编程助手。
然而,技术进步不应忽视人类的角色和价值。正如OpenAI员工所强调的,AI编程助手应被视为"队友"而非替代品,人类监督和专业判断仍然不可或缺。未来的软件开发将更加注重人机协作,结合AI的计算能力和人类的创造力与判断力。
随着AI编程技术的不断发展,我们可以预见一个更加高效、包容和创新的软件开发新时代。在这个时代中,AI助手将成为开发者的得力助手,帮助他们应对更复杂的挑战,创造更出色的软件产品。


