OpenAI 组织内部运作揭秘:文化、技术与挑战
OpenAI,作为当前人工智能浪潮中最引人瞩目的创新企业,其一举一动都牵动着全球目光。ChatGPT 的广泛应用让数亿人为之惊叹,但这家公司内部的运作机制却始终笼罩着一层神秘面纱。本文将深入剖析 OpenAI 的内部文化、技术特点以及面临的挑战,带您一探这家“现代版洛斯阿拉莫斯实验室”的真实面貌。
OpenAI 的文化:混乱与高效并存,集中与分散结合
OpenAI 的文化是一种独特的混合体,它既有初创公司的活力,又有大型组织的复杂性。Calvin 在 OpenAI 工作的一年中,亲身经历了公司从 1000 人迅速扩张到 3000 人的过程。这种快速扩张带来了诸多挑战,如组织结构调整、沟通成本上升以及团队协作方式的多样化。
值得注意的是,OpenAI 内部不同团队的文化差异显著。有些团队像创业公司一样,以极快的节奏冲刺,追求创新;而另一些团队则更像传统企业,遵循流程,稳步推进。Calvin 所在的 Codex 团队就属于前者,他们强调快速行动和灵活应变。
令人惊讶的是,OpenAI 的所有事项几乎都依赖于 Slack 进行沟通和协作。从内部交流到项目协调,再到技术问题讨论和领导层实时对话,Slack 几乎承载了所有信息流。Calvin 在 OpenAI 一年多的时间里,收到的工作邮件不超过 10 封,这足以说明 Slack 在 OpenAI 内部沟通中的重要性。
OpenAI 非常依赖工程师和研究者自下而上地推动项目。Calvin 提到,好的想法可以来自任何地方,项目的进展不是预先规划好的,而是通过不断迭代实现的。这种自下而上的文化也使得 OpenAI 非常重视人才,领导层的晋升往往取决于谁能提出好的想法并将其付诸实践。
OpenAI 的文化还非常强调行动。员工可以直接行动,将想法落地,而无需等待上级批准。Codex 负责人 Andrey 曾告诉 Calvin,OpenAI 的研究员应该被视为“自己的小执行官”,每个人都可以自由探索不同的方向,最终产生有价值的成果。
此外,OpenAI 还秉持着根据新信息及时调整策略的理念。即使公司规模庞大,OpenAI 依然能够快速转向。一旦 OpenAI 决定推进某个方向,就会全力投入,毫不含糊。相比之下,Google 在这方面显得有些迟缓。
OpenAI 是一家极具雄心的公司。即使已经拥有了全球最成功的消费级 AI 应用,它依然在同时推进多个方向,包括 API、基础研究、硬件、代码智能体、图像生成以及一些尚未公开的项目。不同团队之间的协作也非常灵活,当 Codex 团队需要 ChatGPT 工程师的支援时,只需简单沟通,第二天就有高手加入,无需层层审批。
OpenAI 的领导层也非常活跃,高层几乎每天都会在 Slack 上露面,直接参与群聊讨论。这种内部开放与对外的保守形成了鲜明对比。由于 OpenAI 始终处于聚光灯下,为了避免信息外泄,公司内部的保密机制异常严格。员工几乎无法与外人谈论自己具体在做什么,Slack 上有多个权限分级的分组,不同级别的员工能看到的信息差别很大。
尽管外界经常用“神秘”、“封闭”来形容 OpenAI,但 Calvin 认为这是一种对责任的回应。一方面,OpenAI 团队在追求 AGI,这可能会影响全人类;另一方面,OpenAI 的产品已经被数亿用户用于获取医学建议、心理支持,甚至学习和工作协助。因此,OpenAI 的每个人都在尽力做正确的事情。然而,OpenAI 并非一个统一的意志体,它更像是“洛斯阿拉莫斯实验室”的现代版本。
在 AI 安全问题上,OpenAI 比许多人想象中更认真。Calvin 看到有不少团队专门负责构建安全系统,聚焦现实风险,如仇恨言论、滥用内容、政治操控、生物武器设计等。然而,多数成果未对外发表,Calvin 认为 OpenAI 在这方面可以更加透明。
OpenAI 内部不同部门和员工对 OpenAI 的理解也完全不同。有些人仍然将其视为一个“为公益而设立的研究实验室”,而另一些人则更多地从商业、产品或政策角度出发。Calvin 最欣赏的一点是,OpenAI 在“AI 红利的分配”上说到做到,最先进的模型不仅提供给企业级大客户,也对普通用户免费开放。大多数模型的 API 也对开发者开放。
技术的细节:Monorepo、Python 和 Chat 架构
在技术架构层面,OpenAI 的核心代码托管在一个巨大的 monorepo 中,主要以 Python 为主。近年来,Rust 服务的比重逐渐增加,此外也有一些 Golang 项目,通常用于处理诸如网络代理这类系统级任务。这个庞杂的代码库带来一个直观的感受就是:风格极不统一。在这里,你既会看到由 Google 十年老兵写出的、面向大规模系统设计的库,也会碰到刚刚入职的博士生丢进来的临时 Jupyter 笔记本。
基础设施方面,OpenAI 的一切都运行在 Azure 上。然而,OpenAI 很少依赖 Azure 的自动伸缩服务或 IAM 权限系统,而是强烈偏好自研系统。能自己写的,尽量自己写。
人员背景方面,Calvin 观察到一个显著趋势:工程团队中有不少成员来自 Meta,尤其是 Meta 和 Instagram 的基础架构部门。这使得 OpenAI 在某种程度上有点像早期的 Meta:一款现象级的消费级应用,配套基础设施还在建设中,团队渴望快速迭代。
另一个非常核心的架构特征是:“Chat 架构深入骨髓”。自从 ChatGPT 爆红以来,大量代码围绕“聊天消息”与“对话”这两个概念进行组织,这些设计已经成为不可忽视的原语。Calvin 提醒说,如果在开发中忽视这些设计,后果可能很麻烦。
决策架构的过程也体现了 OpenAI 一贯的“行动偏好”:谁做,谁决定架构。这里没有架构委员会,也不太讲“自上而下”的计划,多数技术方案是哪个团队想做、就直接开干。结果,代码库里常常会出现多个“重复造轮子”的场景,光是排队系统、Agent 运行框架,Calvin 至少看到了五六种不同的方法造出类似的结果。
这种快速增长并非没有代价。有些系统因此变得混乱,即使是最顶级的 AI 公司,在快速扩张时也会遇到常见的工程问题。在技术架构的框架之上,Calvin 最重要的项目是参与 Codex 的落地与发布。在离职前的最后三个月里,Codex 的冲刺成了他职业生涯的一大亮点。
2024 年 11 月,OpenAI 正式定下了 2025 年的产品目标:推出一款 coding agent。到 2025 年 2 月,内部已经出现了一些使用模型进行编程任务的工具,效果相当不错。但与此同时,越来越多的 agent 工具问世后,OpenAI 内部感受到了外部压力,团队进入一种近乎狂奔的节奏。从第一行代码写下到产品上线,只用了 7 周时间。Calvin 回忆说,那段时间几乎每天都加班到深夜十一二点,凌晨五点半被刚出生的孩子叫醒,七点又准时出现在办公室,周末也不例外。整个团队拼尽全力。
发布前夜,五个人熬到凌晨四点部署主服务,紧接着清晨八点又准时回到办公室,准备直播和公告上线。当时功能开关一打开,流量瞬间涌入。Calvin 说,他从没见过一个产品仅仅是出现在 ChatGPT 左侧边栏,就能瞬间引发如此大量的用量。他称“这就是 ChatGPT 的力量”。
从怀疑到收获:一次难忘的职业经历
在回顾这一年时,Calvin 承认,最初加入 OpenAI 时他其实是犹豫的。他不确定自己是否适合进入这样一家 AI 巨头,甚至为了预留退路,他在刚加入时对外保持了相当低调。但他为自己设下了三个在 OpenAI 想完成的目标:一是建立对模型训练与能力边界的直觉;二是和一群优秀的人共事并从中学习;三是发布一个真正打动人的产品。现在回看,这一年无疑是他职业生涯中最重要的一段经历之一。他说,很难想象还有哪里能学到这么多。
这段经历也刷新了他对“大品牌”的理解。在参与 Codex 时他意识到, OpenAI 所有的产品设计几乎都是围绕“Pro 用户”展开的,哪怕是面向开发者的 Codex,也主要以个人用户为导向,而非团队。这对来自 B2B 世界的他来说完全是另一种思维方式:ToC 的开关一旦打开,流量立刻涌入,不像 ToB 的传统企业产品,还需要漫长的客户开发周期。
他也第一次站在一线,了解大模型是如何训练的。实验不只是算法问题,调数据、盯指标、调边缘案例,样样都得自己动手。而到了大规模训练时,每一次都像一场不可预知的系统挑战。对其他创业者来说,他也给出两点建议:如果你感到自己创业的项目停滞不前,不妨认真考虑两个方向:要么更激进地出击、增加试错次数;要么加入顶级实验室,去亲眼见证未来是怎么被构建的。在他看来,通向 AGI 的竞赛已经进入三国演义: OpenAI、Anthropic 和 Google 各自代表着不同的技术与文化路径:消费产品、企业服务、工程硬核。Calvin 相信,进入其中任何一家,都会是一段眼界大开的经历,正如过去一年他的亲身经历。