在人工智能领域,一个引人注目的新趋势正在形成:AI系统开始参与自身的构建与改进。OpenAI的最新实践表明,其AI编程助手Codex不仅用于辅助开发者,更已成为改进自身的核心工具。这一创新模式正在重新定义软件开发的方式,也为AI技术的未来发展指明了新方向。
Codex:从辅助工具到自我进化的AI系统
"Codex的大部分功能都由Codex自身构建,几乎完全用于自我提升。"这是OpenAI Codex产品负责人Alexander Embiricos在近期接受Ars Technica采访时透露的关键信息。这一声明揭示了OpenAI正在采用一种递归式开发模式,让AI系统参与自身的进化过程。
Codex作为OpenAI于2025年5月推出的云软件工程代理,能够处理编写功能、修复错误、提出拉取请求等多种任务。该工具在沙盒环境中运行,与用户的代码仓库关联,可并行执行多个任务。OpenAI通过ChatGPT网页界面、命令行界面(CLI)以及VS Code、Cursor和Windsurf等IDE扩展提供Codex服务。
"对于许多人来说,为GitHub Copilot提供动力的模型是AI的第一个'惊叹时刻',"Embiricos解释道,"它展示了AI能够理解你的上下文和意图并加速你完成任务的潜力。"
递归式开发:AI构建AI的新范式
OpenAI的递归式开发模式不仅限于代码生成。Embiricos描述了Codex监控自身训练运行、处理用户反馈并'决定'下一步构建内容的场景。"我们有地方会让Codex查看反馈然后决定该做什么,"他说,"Codex正在为其自身的训练运行编写大量研究工具,我们正在尝试让Codex监控自己的训练运行。"
这种使用工具构建更好工具的模式在计算历史上有着深厚的根基。工程师在1960年代手工设计第一批集成电路,然后根据这些图纸制造物理芯片。这些芯片驱动的计算机运行了第一个电子设计自动化(EDA)软件,使工程师能够设计出任何人都无法手动绘制的复杂电路。现代处理器包含数十亿晶体管,其排列模式只因为软件才成为可能。OpenAI使用Codex构建Codex似乎遵循了同样的模式:每一代工具都创造能力,为下一代提供基础。
实际应用:从Sora Android看Codex的威力
Codex内部影响最显著的例子来自OpenAI对Sora Android应用的开发。Embiricos表示,借助该工具,公司仅用四名工程师就从零开始构建了这款应用,并在28天内将其发布到应用商店。
"Sora Android应用由四名工程师从零开始构建,"Embiricos告诉Ars,"用了18天时间完成开发,然后我们在28天内将其发布到应用商店。"工程师们已有iOS应用和服务器端组件可以参考,因此专注于构建Android客户端。他们使用Codex帮助规划架构、生成不同组件的子计划并实现这些组件。
Codex团队的设计师Ed Bayes描述了该工具如何改变他的工作流程。Bayes表示,Codex现在与Linear等项目管理工具和Slack等通信平台集成,使团队成员能够直接向AI代理分配编码任务。"你可以添加Codex,基本上可以向它分配问题,"Bayes告诉Ars,"Codex实际上是你工作空间中的团队成员。"
这种集成意味着当有人在Slack频道发布反馈时,他们可以标记Codex并要求它修复问题。代理将创建拉取请求,团队成员可以在同一线程中审查和迭代更改。"它基本上模拟了这种同事,并出现在你工作的任何地方,"Bayes说。
市场竞争:AI编程工具的百家争鸣
尽管OpenAI声称Codex内部应用成功,但独立研究显示AI编程工具对生产力的提升效果不一。METR在2025年7月发表的一项研究发现,在使用AI工具处理复杂、成熟的代码库时,经验丰富的开源开发者实际上速度慢了19%——尽管研究人员指出AI在较简单项目上可能表现更好。
OpenAI在AI编程市场面临多方面竞争。Anthropic的Claude Code和Google的Gemini CLI提供类似的基于终端的代理编程体验。本周,Mistral AI发布了Devstral 2以及名为Mistral Vibe的CLI工具。与此同时,像Cursor这样的初创公司已经围绕AI编程构建了专用IDE,据报道年收入达3亿美元。
面对AI模型在作为事实资源时众所周知的编造问题,编程是否已成为LLM的杀手级应用?OpenAI是否注意到编程似乎是当今AI模型明确的商业用例,风险低于使用AI语言模型进行写作或作为情感伴侣?
"我们绝对注意到编程是代理将快速变得出色的领域,而且有很大的经济价值,"Embiricos说,"我们认为专注于Codex与我们的使命非常一致。我们能够为开发者提供大量价值。此外,开发者为其他人构建东西,所以我们本质上通过他们实现了扩展。"
人类与AI:协作而非替代
像Codex这样的工具会威胁软件开发者的工作吗?Bayes承认存在担忧,但表示Codex并未减少OpenAI的人员编制,"总是有人类在循环中,因为人类实际上可以阅读代码。"同样,这两位人士不认为未来会出现某种形式的人类监督下Codex自行运行的情况。他们认为该工具是人类潜力的放大器,而非替代品。
Embiricos区分了"氛围编码"和"氛围工程":前者是开发者不经密切审查接受AI生成的代码,后者是研究人员Simon Willison提出的概念,即人类保持参与循环。"在我们的代码库中,我们看到更多的是氛围工程,"他说,"你要求Codex处理那个,甚至可能先要求一个计划。来回讨论,迭代计划,然后你与模型一起处于循环中,仔细审查其代码。"
他补充说,氛围编码在原型和一次性工具中仍有其位置。"我认为氛围编码很棒,"他说,"现在你作为人类可以决定你想在代码上投入多少注意力。"
未来展望:从专业工具到通用代理
OpenAI的长期愿景涉及使编程代理对没有编程经验的人有用。"全人类不会打开IDE甚至知道终端是什么,"Embiricos说,"我们现在正在构建一个仅面向软件工程师的编程代理,但我们认为我们构建的形态实际上将成为更通用代理的有用之物。"
过去一年,像GPT-4.5这样的"单体"大语言模型在前沿基准测试进展方面似乎已成为某种死胡同,因为AI公司转向模拟推理模型以及由多个并行运行的AI模型构建的代理系统。当被询问像Codex这样的代理是否代表从现有LLM技术中榨取效用的最佳路径时,Embiricos驳斥了AI能力已趋于平缓的担忧。"我认为我们离平缓还很远,"他说,"如果你看看我们研究团队的速度,我们几乎每周或每隔一周都在发布模型。"
他指出了最近的改进,据报道GPT-5-Codex在相同智能水平下完成任务的速度比其前身快30%。在测试期间,公司已经看到该模型在复杂任务上独立工作24小时。
技术挑战与伦理考量
尽管前景广阔,但Codex等AI编程工具仍面临诸多挑战。首先是代码质量问题。虽然AI可以快速生成代码,但其质量参差不齐,需要人工审查和优化。其次是安全性问题,AI生成的代码可能包含漏洞或安全隐患,需要严格的安全审查流程。
另一个重要挑战是知识产权和版权问题。当AI生成代码时,其原创性和所有权归属仍存在法律灰色地带。OpenAI需要建立明确的框架来处理这些问题,保护开发者权益的同时促进技术创新。
此外,随着AI编程工具的普及,数字鸿沟可能进一步扩大。没有编程经验的人可能更难利用这些工具,而技术熟练的开发者则可能获得更大优势。OpenAI需要考虑如何使这些工具更加包容和易于使用。
行业影响:软件开发模式的变革
Codex等AI编程工具的兴起正在改变软件开发的根本模式。传统的软件开发流程涉及需求分析、设计、编码、测试、部署等多个阶段,每个阶段都需要专业知识和技能。而AI编程工具的出现正在模糊这些阶段的界限,使开发过程更加流畅和高效。
首先,AI编程工具正在改变开发者的工作方式。开发者不再需要编写大量重复性代码,而是可以专注于更高层次的架构设计和业务逻辑实现。这使开发者能够更专注于创造性工作,提高工作效率和满意度。
其次,AI编程工具正在降低软件开发的门槛。非专业开发者也可以通过自然语言描述需求,让AI工具生成相应的代码,实现快速原型开发和验证。这将促进更多创新想法的实现,加速技术迭代和产品创新。
最后,AI编程工具正在改变团队协作模式。如前所述,Codex已经与Linear、Slack等团队协作工具集成,成为团队中的'虚拟成员'。这种协作模式将使开发团队更加灵活和高效,能够快速响应需求变化和市场挑战。
结论:AI编程的新时代
OpenAI使用Codex构建Codex的实践代表了AI技术发展的一个重要里程碑。这种递归式开发模式不仅加速了工具自身的进化,也为整个AI领域提供了新的思路和方法。随着AI编程工具的不断成熟和完善,我们有理由相信,软件开发将进入一个更加智能、高效和包容的新时代。
然而,我们也需要认识到,AI编程工具并非万能解决方案。它们仍然需要人类的指导和监督,需要解决质量、安全、伦理等多方面挑战。只有在充分理解和把握这些挑战的基础上,我们才能充分发挥AI编程工具的潜力,推动软件开发领域的持续创新和发展。
正如Embiricos所言:"我们绝对注意到编程是代理将快速变得出色的领域,而且有很大的经济价值。"在未来的软件开发中,AI编程工具将成为不可或缺的伙伴,与人类开发者共同创造更加美好的数字世界。


