在人工智能领域,OpenAI无疑是最耀眼的明星之一。其开发的ChatGPT等产品,已深刻影响了数亿用户。然而,这家公司的内部运作机制却鲜为人知。本文将深入剖析OpenAI的组织文化、技术架构以及推动其不断创新的核心要素,带您一探这家神秘组织的运作模式。
OpenAI的文化基因:混乱中的高效,集中下的分散
OpenAI的文化是一种独特的混合体。一位曾在OpenAI工作过的工程师Calvin,分享了他过去一年在这家公司的所见所感。他 описывает 这家公司既混乱又高效,既集中又分散。
起初,OpenAI的员工规模约为1000人,但在短短一年内,迅速扩张至3000多人。这种高速扩张也带来了许多大型企业 común 的问题,比如组织结构的频繁变动、沟通成本的增加以及团队协作方式的多样化。Calvin观察到,不同团队之间的文化差异显著,有些团队像创业公司一样充满活力,日夜冲刺;而另一些团队则更像传统企业,遵循既定的流程稳步推进。他所在的Codex团队就偏向前者,以极快的节奏和灵活的方向为特点,秉持着“先做再说”的行动原则。
令人惊讶的是,OpenAI几乎所有的事项都在Slack上进行,包括内部交流、项目协调、技术问题讨论以及领导层的实时对话。Calvin在OpenAI工作一年多,收到的工作邮件不超过10封。这种高度依赖协作软件的沟通方式,极大地提高了信息传递的效率。
自下而上的创新文化
OpenAI非常依赖工程师和研究人员“自下而上”地推动项目。Calvin强调,好的想法可以来自任何地方,项目的进展不是预先规划好的,而是通过不断迭代实现的。这种文化鼓励每一位员工积极思考、大胆尝试,并为创新提供土壤。OpenAI的领导层晋升,往往基于谁能提出好的想法并将其成功落地,这充分体现了其任人唯贤的用人理念。
行动至上的文化偏好
OpenAI的企业文化鲜明地偏爱行动。员工可以直接行动,将想法付诸实践,而无需等待上级的层层审批。Codex负责人曾告诉Calvin,OpenAI的研究员应该被视为“自己的小执行官”,每个人都可以自由探索不同的方向,最终产生意想不到的成果。
快速调整策略的能力
OpenAI能够根据新的信息及时调整策略。即使公司规模庞大,它仍然保持着快速转向的能力。一旦OpenAI决定推进某个方向,就会全力投入、毫不含糊。Calvin认为,与OpenAI相比,谷歌在行动上显得迟缓许多。
雄心勃勃的目标
Calvin评价OpenAI是他见过的最具雄心的公司之一。即使已经拥有全球最成功的消费级AI应用,它仍在同时推进十几个方向,包括API、基础研究、硬件、代码智能体、图像生成以及一些尚未公开的项目。不同团队之间的协作也非常灵活,人才可以随时加入,无需等待审批或季度规划,实现了真正的“即插即用”。
开放的内部环境与严格的对外保密
OpenAI的领导层非常活跃,高层几乎每天都会在Slack上露面,直接参与群聊讨论,而不是那种“遥不可及”的管理者。这种内部开放的文化,与严格的对外保密形成了鲜明对比。Calvin表示,刚入职时,OpenAI所处的“聚光灯中心”让他震惊。为了避免信息外泄,公司内部的保密机制非常严格。员工可以访问的信息,根据权限级别而异。公司的财务数据、收入、GPU成本等核心信息都受到严密保护。
对责任的回应
Calvin认为,OpenAI的“神秘”和“封闭”是对责任的回应。团队在追求AGI,这可能会影响全人类;同时,产品已被数亿用户用于获取医学建议、心理支持以及学习和工作协助。此外,OpenAI还在与谷歌、Meta、Anthropic等公司展开激烈的竞争。作为行业领导者,OpenAI需要面对媒体的审视,并小心翼翼地把握人类对AI开发和掌握的边界。Calvin表示,他在OpenAI遇到的每个人都在尽力做“对的事情”。
AI安全问题的高度重视
在AI安全问题上,OpenAI比许多人想象的更认真。Calvin看到有许多团队专门负责构建安全系统,聚焦于现实风险,如仇恨言论、滥用内容、政治操控、生物武器设计等。遗憾的是,这些成果大多未对外发表。Calvin认为,OpenAI在这方面可以更加透明。
多元化的价值观
OpenAI内部对公司的理解也存在差异。有些人仍然将其视为一个“为公益而设立的研究实验室”,而另一些人则更多地从商业、产品或政策角度出发。无论如何,Calvin最欣赏的是公司在“AI红利的分配”上说到做到。最先进的模型不会只留给企业级大客户,任何普通用户都可以免费使用ChatGPT,并且大多数模型的API也对开发者开放。
技术架构的细节:Monorepo、Python与Chat架构
在技术架构层面,Calvin透露,OpenAI的核心代码托管在一个巨大的monorepo中,主要以Python为主。近年来,Rust服务的比重逐渐增加,此外还有一些Golang项目,通常用于处理网络代理等系统级任务。这个庞杂的代码库的风格极不统一,既有由谷歌十年老兵编写的、面向大规模系统设计的库,也有刚刚入职的博士生提交的临时Jupyter笔记本。
基础设施方面,OpenAI的一切都运行在Azure上。不过,OpenAI很少依赖Azure的自动伸缩服务或IAM权限系统,而是倾向于自主研发系统。
人员背景与早期Meta的影子
Calvin观察到一个显著趋势:工程团队中有不少成员来自Meta,尤其是Meta和Instagram的基础架构部门。这使得OpenAI在某种程度上有点像早期的Meta:一款现象级的消费级应用、配套基础设施还在建设中、团队渴望快速迭代。
深入骨髓的Chat架构
另一个非常核心的架构特征是“Chat架构深入骨髓”。自从ChatGPT爆红以来,大量代码围绕“聊天消息”与“对话”这两个概念进行组织。这些设计已经成为不可忽视的原语。如果在开发中忽视这些设计,后果可能很麻烦。
行动偏好下的决策架构
决策架构的过程也体现了OpenAI一贯的“行动偏好”:谁做,谁决定架构。这里没有架构委员会,也不太讲“自上而下”的计划,多数技术方案是哪个团队想做、就直接开干。这导致代码库里常常出现多个“重复造轮子”的场景。即使是最顶级的AI公司,在快速扩张时也会遇到常见的工程问题。
Codex的落地与发布
在技术架构的框架之上,Calvin最重要的项目是参与Codex的落地与发布。在离职前的最后三个月里,Codex的冲刺成了他职业生涯的一大高光。2024年11月,OpenAI正式确定了2025年的产品目标:推出一款coding agent。到2025年2月,内部已经出现了一些使用模型进行编程任务的工具,效果相当不错。但与此同时,越来越多的agent工具问世,OpenAI内部感受到了外部压力,团队进入一种几近狂奔的节奏。从第一行代码写下到产品上线,只用了7周时间。
Calvin回忆说,那段时间几乎每天都加班到深夜十一二点,凌晨五点半被刚出生的孩子叫醒,七点又准时出现在办公室,周末也不例外。整个团队拼尽全力,最终打造出了一个可发布、可上线、可直接使用的AI编程Agent。
发布前夜,五个人熬到凌晨四点部署主服务,紧接着清晨八点又准时回到办公室,准备直播和公告上线。当时功能开关一打开,流量瞬间涌入。Calvin说,他从没见过一个产品仅仅是出现在ChatGPT左侧边栏,就能瞬间引发如此大量的用量。他称“这就是ChatGPT的力量”。
从怀疑到收获:OpenAI的价值与启示
在回顾这一年时,Calvin承认,最初加入OpenAI时他其实是犹豫的。他不确定自己是否适合进入这样一家AI巨头。但他为自己设定了三个在OpenAI想完成的目标:一是建立对模型训练与能力边界的直觉;二是和一群优秀的人共事并从中学习;三是发布一个真正打动人的产品。现在回看,这一年无疑是他职业生涯中最重要的一段经历之一。他说,很难想象还有哪里能学到这么多。
这段经历也刷新了他对“大品牌”的理解。在参与Codex时他意识到,OpenAI所有的产品设计几乎都是围绕“Pro用户”展开的,哪怕是面向开发者的Codex,也主要以个人用户为导向,而非团队。这对来自B2B世界的他来说完全是另一种思维方式:ToC的开关一旦打开,流量立刻涌入,不像ToB的传统企业产品,还需要漫长的客户开发周期。
他也第一次站在一线,了解大模型是如何训练的。实验不只是算法问题,调数据、盯指标、调边缘案例,样样都得自己动手。而到了大规模训练时,每一次都像一场不可预知的系统挑战。
对其他创业者来说,他也给出两点建议:如果你感到自己创业的项目停滞不前,不妨认真考虑两个方向:要么更激进地出击、增加试错次数;要么加入顶级实验室,去亲眼见证未来是怎么被构建的。
在他看来,通向AGI的竞赛已经进入三国演义:OpenAI、Anthropic和Google各自代表着不同的技术与文化路径:消费产品、企业服务、工程硬核。Calvin相信,进入其中任何一家,都会是一段眼界大开的经历,正如过去一年他的亲身经历。