人机对决!程序员险胜AI,代码世界谁主沉浮?

1

在科技日新月异的时代浪潮中,人工智能(AI)正以前所未有的速度渗透到我们生活的方方面面。从智能家居到自动驾驶,AI 的应用无处不在,同时也引发了关于人类与机器之间竞争与合作的深刻思考。近日,一场备受瞩目的“人机大战”——2025 年 AtCoder 世界巡回总决赛 Heuristic 竞赛,再次将这一话题推向了风口浪尖。

Przemysław Dębiak (right) receives an award for winning the 2025 AtCoder World Finals Heuristic Contest.

这场比赛并非简单的技术展示,而是一场对人类智慧和机器能力的终极考验。由波兰程序员 Przemysław Dębiak(网名“Psyho”)领衔的人类团队,与 OpenAI 打造的先进 AI 模型展开了一场长达 10 小时的编码马拉松。这场比赛不仅是对选手编程技能的挑战,更是对他们耐力、意志和解决复杂问题能力的极限考验。最终,在精疲力竭的状态下,Dębiak 险胜 AI 模型,赢得了这场意义非凡的胜利。

Dębiak 在赛后感叹道:“人类暂时取得了胜利!”,同时坦言自己身心俱疲。这场胜利不仅仅属于 Dębiak 个人,更象征着人类在与 AI 的竞争中,依然保持着独特的优势和价值。这场比赛也引发了人们对于 AI 在编程领域发展前景的广泛关注和深入思考。

这场比赛由日本平台 AtCoder 举办,该平台以举办竞技编程比赛和维护全球排名而闻名。本次比赛堪称史上首个 AI 模型与顶尖人类程序员在重要的现场世界锦标赛中正面交锋的案例。OpenAI 作为赞助商参与了本次活动,并派出 AI 模型参加了名为“人机对战”的特别表演赛。尽管 AI 拥有不知疲倦的特性,但最终还是惜败于人类。

Dębiak 在社交平台 X 上写道,在连续三天参加多场比赛后,他几乎没有时间睡觉。“我已精疲力尽……我快要死了。”

比赛要求参赛者在 600 分钟内解决一个复杂的优化问题。这场比赛与美国民间故事“约翰·亨利”有着异曲同工之妙。约翰·亨利是一位钢铁工人,在 19 世纪 70 年代与蒸汽动力钻孔机展开竞赛。与亨利对抗工业自动化的传奇故事一样,Dębiak 的胜利代表着人类专家挑战自身极限,以证明在人工智能不断发展的时代,人类技能仍然至关重要。

人类耐力与 AI 效率的较量

AtCoder 世界巡回总决赛代表了竞争性编程领域最顶级的赛事之一,仅邀请全球排名前 12 位的程序员参加。Heuristic 部门专注于“NP-hard”优化问题。在编程中,启发式算法是一种问题解决技术,它通过捷径和有根据的猜测来找到足够好的解决方案,因为完美的答案需要太长时间才能计算出来。

所有参赛者,包括 OpenAI,都必须使用 AtCoder 提供的相同硬件,以确保人类和 AI 参赛者之间的公平竞争。根据比赛规则,参赛者可以使用 AtCoder 平台上提供的任何编程语言,重新提交不会受到惩罚,但每次提交之间必须等待五分钟。

Leaderboard results for the 2025 AtCoder World Finals Heuristic Contest, showing Dębiak (as

最终的比赛结果显示,Psyho 以 1,812,272,558,909 分的成绩位居榜首,而 OpenAI 的模型(显示为“OpenAIAHC”)的得分为 1,654,675,725,406 分,差距约为 9.5%。OpenAI 的人工智能参赛者是一个类似于 o3 的定制模拟推理模型,最终排名第二,领先于通过常年排名获得资格的其他 10 位人类程序员。

OpenAI 将第二名的成绩描述为 AI 模型在竞争性编程领域的一个里程碑。“像 o3 这样的模型在编码/数学竞赛中排名前 100,但据我们所知,这是首次在顶级编码/数学竞赛中排名前 3,”该公司一位发言人在给 Ars Technica 的电子邮件中表示。“像 AtCoder 这样的赛事为我们提供了一种测试我们的模型在战略性推理、长期规划以及通过试错改进解决方案的能力,就像人类一样。”

AI 编码的崛起

尽管 OpenAI 对比赛结果意义的评估听起来过于乐观,但毫无疑问,许多 AI 模型在完成编码任务方面的能力在过去几年中得到了显著提高。例如,斯坦福大学 2025 年人工智能指数报告显示,在 SWE-bench(一种旨在衡量编码能力的基准)上,“人工智能系统在 2023 年仅能解决 4.4% 的编码问题,而这一数字在 2024 年跃升至 71.7%。”

编码是 OpenAI、Anthropic、Google 和 Meta 提供的聊天机器人最常见的用途之一,而 GitHub Copilot 和 Cursor 等工具已成为许多专业开发人员的标准工具。GitHub 2024 年的一项调查显示,超过 90% 的开发人员现在在其工作流程中使用 AI 编码工具,尽管最近的一项研究表明,AI 辅助可能无法像开发人员认为的那样节省那么多时间。

即便如此,随着 AI 模型在编码等任务中的能力不断增强,Dębiak 的胜利感觉不再像是一场永久的胜利,而更像是长期发展轨迹中的一个值得注意的数据点。与亨利致命的胜利不同,这位程序员活了下来,可以继续编码,尽管他可能会发现自己下次要与一台更快的机器竞争。

Dębiak 在 X 上表示:“老实说,这种炒作感觉有点奇怪。从未想过会有这么多人对编程竞赛感兴趣。”

就目前而言,人类发现意外方法的能力仍然是独一无二的。但随着 OpenAI 和其他公司继续改进他们的模型,未来的 AtCoder 参赛者可能会发现自己不再是与 AI 竞争,而是更多地与它并肩作战——或者根本不参加比赛。