人机大战:程序员击败 OpenAI,捍卫人类编程荣耀

0

在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到我们生活的方方面面。从自动驾驶汽车到智能家居,AI 的应用无处不在。然而,在某些领域,人类的智慧和创造力仍然占据着不可替代的地位。最近,一场备受瞩目的“人机大战”再次引发了人们对这一话题的思考。在 2025 年 AtCoder 世界总决赛启发式竞赛中,一位名叫 Przemysław Dębiak 的波兰程序员,凭借着惊人的毅力和精湛的技艺,击败了 OpenAI 强大的 AI 模型,捍卫了人类在编程领域的荣耀。

Przemysław Dębiak (right) receives an award for winning the 2025 AtCoder World Finals Heuristic Contest.

这场比赛不仅是一场技术实力的较量,更是一场意志和耐力的考验。Dębiak 在连续三天的多场比赛中几乎没有合眼,身体和精神都承受着巨大的压力。然而,他凭借着对编程的热爱和对胜利的渴望,坚持到了最后一刻。在长达 10 个小时的编程马拉松中,他与 OpenAI 的 AI 模型展开了激烈的角逐。最终,他以微弱的优势险胜对手,赢得了这场意义非凡的胜利。这场胜利被许多人视为“人类的胜利”,它证明了在某些特定领域,人类的创造力和解决问题的能力仍然优于 AI。

当然,我们不能忽视 AI 在编程领域的巨大进步。近年来,AI 模型在代码生成、错误检测和代码优化等方面取得了显著的进展。许多开发者已经开始使用 AI 工具来提高工作效率和代码质量。然而,AI 仍然无法完全取代人类程序员。在面对复杂的、需要创新性解决方案的问题时,人类的直觉、经验和创造力往往能够发挥关键作用。

Dębiak 的胜利并非偶然,它体现了人类在特定领域所拥有的独特优势。在这次比赛中,选手们需要解决一个复杂的优化问题。这类问题没有完美的解决方案,只有不断改进的策略。Dębiak 凭借着对问题的深刻理解和灵活的应变能力,不断调整自己的算法,最终找到了优于 AI 模型的解决方案。

Leaderboard results for the 2025 AtCoder World Finals Heuristic Contest, showing Dębiak (as

这场比赛也引发了人们对 AI 发展方向的思考。AI 的目标应该是服务于人类,而不是取代人类。AI 应该成为我们解决问题的工具,而不是我们的竞争对手。通过与 AI 协同合作,我们可以更好地发挥人类的创造力和解决问题的能力,共同推动科技的进步和社会的发展。

编程马拉松:人类耐力与 AI 效率的较量

AtCoder 世界总决赛是竞争性编程领域最负盛名的赛事之一,只有在过去一年中表现最出色的 12 名程序员才能获得参赛资格。启发式竞赛侧重于“NP 难”优化问题。在编程中,启发式是一种问题解决技术,它通过捷径和有根据的猜测来寻找足够好的解决方案,而完美的答案需要太长时间才能计算出来。

包括 OpenAI 在内的所有参赛者都受到 AtCoder 提供的相同硬件的限制,确保了人类和 AI 参赛者之间的公平竞争。根据比赛规则,参赛者可以使用 AtCoder 上的任何编程语言,重新提交没有惩罚,但两次提交之间必须等待五分钟。

最终的比赛结果显示,Psyho 以 1,812,272,558,909 分的成绩名列前茅,而 OpenAI 的模型(列为“OpenAIAHC”)获得了 1,654,675,725,406 分,差距约为 9.5%。OpenAI 的人工智能参赛者是一种类似于 o3 的定制模拟推理模型,在 10 名通过常年排名获得资格的其他人类程序员中排名第二。

OpenAI 将第二名的成绩描述为 AI 模型在竞争性编程中的一个里程碑。“像 o3 这样的模型在编码/数学竞赛中排名前 100,但据我们所知,这是在顶级编码/数学竞赛中首次进入前 3 名,”该公司发言人在一封电子邮件中告诉 Ars Technica。“像 AtCoder 这样的活动为我们提供了一种测试我们的模型在战略上推理、长期规划以及通过试错改进解决方案的能力——就像人类一样。”

AI 编码的兴起

虽然 OpenAI 对比赛结果的含义的评估听起来可能过于乐观,但毫无疑问,许多 AI 模型在完成编码任务方面的能力在过去几年中得到了显着提高。例如,斯坦福大学 2025 年 AI 指数报告显示,在 SWE-bench(一种旨在衡量编码能力的基准)上,“AI 系统在 2023 年只能解决 4.4% 的编码问题,而这一数字在 2024 年跃升至 71.7%。”

编码是 OpenAI、Anthropic、Google 和 Meta 的聊天机器人最常见的用途之一,而 GitHub Copilot 和 Cursor 等工具已成为许多专业开发人员的标准工具,GitHub 2024 年的一项调查显示,超过 90% 的开发人员现在在他们的工作流程中使用 AI 编码工具,尽管最近的一项研究表明,AI 辅助可能无法像开发人员认为的那样节省他们的时间。

即便如此,随着 AI 模型在编码等任务方面的能力不断提高,Dębiak 的胜利感觉不再像是一场永久的胜利,而更像是长期发展轨迹中的一个值得注意的数据点。与亨利致命的胜利不同,这位程序员活着又编码了一天,尽管他可能会发现下次自己与一台更快的机器赛跑。

“老实说,炒作感觉有点奇怪,”Dębiak 在 X 上说。“从未想到这么多人会对编程竞赛感兴趣。”

就目前而言,人类寻找意想不到方法的能力仍然是独一无二的。但随着 OpenAI 和其他公司继续改进他们的模型,未来的 AtCoder 参赛者可能会发现自己不再与 AI 竞争,而是更多地与 AI 并肩作战——或者根本不竞争。