在人工智能领域,一个引人注目的趋势正在形成:AI系统开始用于改进和构建更先进的AI系统。OpenAI的最新实践完美诠释了这一趋势——公司正使用其AI编程助手Codex来改进自身,形成了一个自我进化的闭环系统。这一创新不仅加速了开发过程,还重新定义了人机协作模式,为软件开发带来了前所未有的可能性。
Codex:不只是代码生成器
OpenAI于2025年5月以研究预览形式推出了Codex,这是一个基于云的软件工程代理,能够处理编写功能、修复错误和提出拉取请求等任务。与传统的代码补全工具不同,Codex运行在链接到用户代码库的沙盒环境中,可以并行执行多个任务。OpenAI通过ChatGPT的网页界面、命令行界面(CLI)以及VS Code、Cursor和Windsurf等IDE扩展提供Codex服务。
"绝大多数的Codex是由Codex自身构建的,"OpenAI的Codex产品负责人Alexander Embiricos表示,"它几乎完全被用于改进自身。"
这种自我改进的能力使Codex区别于传统的代码生成工具。它不仅能够生成代码,还能理解上下文、规划任务、执行测试,并根据反馈进行迭代。这种全方位的能力使Codex更像是一个真正的开发团队成员,而不仅仅是代码补全工具。
自我进化的闭环系统
Codex最引人注目的特点是其自我进化的能力。OpenAI的工程师们已经建立了一个系统,让Codex能够监控自己的训练运行,处理用户反馈,并"决定"下一步要构建什么。
"我们有地方会让Codex查看反馈,然后决定该怎么做,"Embiricos解释道,"Codex正在为其自己的训练运行编写大量研究工具,我们正在实验让Codex监控自己的训练运行。"
这种自我监控和改进的能力形成了一个正反馈循环:Codex产生的代码成为其自身的一部分,从而影响下一版本Codex的行为。这种模式在计算历史上有着深厚的根源——工程师们在1960年代手工设计第一块集成电路,然后根据这些图纸制造物理芯片。这些芯片又运行了第一个电子设计自动化(EDA)软件,使工程师能够设计出任何人都无法手动绘制的复杂电路。现代处理器包含数十亿晶体管,这些排列模式的存在仅仅是因为软件使其成为可能。OpenAI使用Codex构建Codex似乎遵循了同样的模式:每一代工具都创造了为下一代提供能力的基础。
实际应用案例:Sora Android的快速开发
Codex在OpenAI内部最显著的应用案例之一是Sora Android应用的开发。Embiricos透露,借助Codex,OpenAI的四名工程师在18天内从零开始构建了该应用,并在28天内将其发布到应用商店。
"工程师们已经有了iOS应用和服务器端组件可以参考,所以他们专注于构建Android客户端,"Embiricos解释道,"他们使用Codex帮助规划架构,为不同组件生成子计划,并实现这些组件。"
这一案例展示了Codex如何显著加速开发过程,特别是在需要快速构建跨平台应用时。通过自动化繁琐的任务和提供架构建议,Codex使开发团队能够专注于更高层次的设计和决策。
人机协作新模式:"AI队友"
OpenAI将Codex视为团队中的一名"初级开发者",并希望它随着时间推移能够成长为"高级开发者"。这种"队友"理念体现在Codex与工作流程的深度集成中。
"如果你要入职一名初级开发者,你会如何引导他们?你会给他们一个Slack账户,一个Linear账户,"Codex团队的设计师Ed Bayes说道,"它不仅仅是你可以在终端中使用的工具,它还会来到你身边,坐在你的团队中。"
Codex现在与Linear等项目管理工具和Slack等通信平台集成,使团队成员能够直接向AI代理分配编码任务。当有人在Slack频道发布反馈时,他们可以标记Codex并要求它修复问题。代理将创建拉取请求,团队成员可以通过相同的线程审查和迭代更改。
对于Bayes这样的设计师来说,Codex改变了他们的工作方式。"它赋予了你更多杠杆。它使你能够跨栈工作,基本上能够做更多的事情,"他说。他指出,OpenAI的设计师现在通过直接构建功能来原型化功能,使用Codex处理实现细节。
挑战与限制
尽管Codex取得了显著成功,但独立研究表明AI编码工具的效果并不总是积极的。2025年7月发表的一项METR研究发现,在使用AI工具处理复杂、成熟的代码库时,经验丰富的开源开发者实际上慢了19%——尽管研究人员指出AI在较简单的项目上可能表现更好。
此外,AI模型在作为事实资源使用时存在众所周知的"虚构"问题。当人们尝试使用AI语言模型进行写作或作为情感伴侣时,这种风险尤为明显。相比之下,编程似乎成为LLM的一个明确业务用例,风险较小。
"我们绝对注意到编程是代理将很快变得擅长的地方,而且有很多经济价值,"Embiricos承认,"我们认为专注于Codex与我们的使命非常一致。我们可以为开发者提供很多价值。而且,开发者为其他人构建东西,所以我们通过他们内在地扩展了影响。"
未来展望:从专业工具到通用代理
OpenAI的长期愿景是使编码代理对没有编程经验的人也有用。"全人类不会打开IDE甚至知道终端是什么,"Embiricos说,"我们现在正在构建一个仅针对软件工程师的编码代理,但我们认为我们所构建的形状将成为一个更有用的通用代理。"
这一愿景反映了AI技术发展的更广泛趋势:从专业工具向通用智能体的转变。随着AI系统变得越来越复杂和自主,它们可能会在更多领域成为人类不可或缺的合作伙伴,而不仅仅是编程。
对软件开发的深远影响
Codex的出现和发展对软件开发行业产生了深远影响。首先,它改变了开发者的工作方式,将他们从繁琐的编码任务中解放出来,使他们能够专注于更高层次的创造性工作。其次,它加速了开发周期,使团队能够更快地交付高质量软件。最后,它降低了编程的门槛,使非专业开发者也能参与软件开发过程。
然而,这种转变也带来了新的挑战和问题。开发者需要适应与AI代理协作的新工作方式,学习如何有效地指导和监督这些系统。同时,行业也需要建立新的标准和最佳实践,以确保AI生成代码的质量和安全性。
结语:AI作为增强而非替代
尽管AI编码工具如Codex正在改变软件开发的面貌,但OpenAI的领导者强调,这些工具旨在增强人类能力,而非替代人类开发者。"总是有人类在循环中,因为人类实际上可以阅读代码,"Bayes说道。
这种观点反映了AI技术发展的更广泛趋势:AI系统作为人类能力的放大器,而非替代品。通过将人类创造力与AI的计算能力相结合,我们可以实现比单独使用任何一方更强大的结果。
随着Codex和其他AI编码工具的不断发展,我们可以期待看到软件开发进入一个新时代——一个人类和AI紧密协作、共同创造更复杂、更强大软件的时代。这种协作不仅将提高开发效率,还将开启新的可能性,使软件能够解决以前被认为过于复杂而无法实现的问题。


