OpenAI内部运作深度剖析:文化、技术与挑战
作为当前人工智能浪潮中最引人瞩目的公司,OpenAI的一举一动都备受关注。ChatGPT的广泛应用让人们见识到了AI的潜力,但这家公司的内部运作机制却始终笼罩着一层神秘的面纱。本文将深入剖析OpenAI的内部文化、技术特点以及所面临的挑战,力求还原一个真实、复杂的OpenAI。
OpenAI的文化:混乱与高效并存
OpenAI的文化可以用“既混乱又高效,既集中又分散”来形容。随着公司规模的快速扩张,组织结构也在不断调整。Calvin在加入OpenAI时,公司大约有1000人,短短一年时间,员工数量就超过了3000。这种快速扩张带来了大公司常见的挑战:组织结构频繁变动、沟通成本上升、团队协作方式多样化。
不同的团队文化之间存在显著差异。有些团队像创业公司一样,夜以继日地冲刺;而另一些团队则更像传统企业,遵循既定的流程推进。Calvin所在的Codex团队就属于前者,节奏快,方向灵活,强调“先做再说”。
值得一提的是,OpenAI几乎所有的事项都在Slack上进行,包括内部交流、项目协调、技术问题讨论,甚至领导层的实时对话。Calvin在OpenAI工作一年多,收到的工作邮件不超过10封。
OpenAI非常依赖工程师和研究人员“自下而上”地推动项目。好的想法可以来自任何地方,进展不是预先规划的,而是在不断迭代中实现的。这种文化使得OpenAI非常任人唯贤,领导层的晋升往往基于谁能提出好主意并将其落地。
OpenAI的公司文化还鲜明地偏爱行动。员工可以直接行动,将想法付诸实践,而无需等待上层批准。Codex负责人Andrey曾告诉Calvin,OpenAI的研究员应该被视为“自己的小执行官”,每个人都可以探索自己的方向,最终看能产生什么成果。
另一个显著特征是,OpenAI能够根据新信息及时调整策略。即使公司规模庞大,依然保持着快速转向的能力。一旦OpenAI决定推进某个方向,通常会全力投入、毫不含糊。与OpenAI相比,某些大型科技公司可能会显得迟缓。
OpenAI是一家极具雄心的公司。即使已经拥有ChatGPT这样成功的消费级AI应用,它仍在同时推进十几个方向,包括API、基础研究、硬件、代码智能体、图像生成以及一些尚未公开的项目。不同团队之间的协作也非常灵活。例如,Codex团队在推出前,急需ChatGPT工程师的支援,经过一次沟通,第二天就有两位工程师加入,无需层层审批。
OpenAI的领导层也非常活跃,高层几乎每天都会在Slack上露面,直接参与群聊讨论。这种内部开放与对外的保守形成了鲜明对比。OpenAI始终处于聚光灯下,很多新闻在公司内部尚未传开,就已经被媒体抢先报道。因此,为了避免信息外泄,公司内部的保密机制异常严格。员工在任职期间,几乎无法与外人谈论自己具体在做什么。公司的Slack上有多个权限分级的分组,不同级别的员工能看到的信息差别很大。公司的财务数据、收入、GPU成本等核心数字都受到严密保护。
尽管外界经常用“神秘”、“封闭”来形容OpenAI,但这种状态可以理解为一种对责任的回应。OpenAI的团队在追求AGI,其最终目标可能会影响全人类;同时,其产品已经被数亿用户用来获取医学建议、心理支持,甚至学习和工作协助。此外,OpenAI还在竞争激烈的行业中与Google、Meta、Anthropic等公司竞争。作为行业领导者,OpenAI需要面对媒体的审视,并小心翼翼地把握人类对AI开发和掌握的边界。
OpenAI更像是现代版的洛斯阿拉莫斯实验室。最初,一群科学家和工程师在边缘地带探索前沿技术,结果意外地孵化出了ChatGPT。此后,公司逐渐拓展为一个同时面向政府、企业和消费者的庞然大物,而研究成果的好坏尚不可知。
在AI安全问题上,OpenAI比许多人想象中更认真。有专门的团队负责构建安全系统,聚焦于现实风险,如仇恨言论、滥用内容、政治操控、生物武器设计等。然而,多数成果并未对外发表,Calvin认为OpenAI在这方面可以更加透明。
对OpenAI的理解因部门和员工而异。有些人仍然将其视为一个“为公益而设立的研究实验室”,而另一些人则更多地从商业、产品或政策角度出发。然而,最令人欣赏的一点是,OpenAI在“AI红利的分配”上说到做到。最先进的模型不会只留给企业级大客户,任何普通用户都能免费使用ChatGPT。大多数模型的API也对开发者开放。
OpenAI的文化是一种奇特的混合体:既高度去中心化、强调个人驱动,又在某些关键问题上异常克制和谨慎;既像一家科研机构,鼓励想法和理论思考,又像创业公司,保持着惊人的速度和执行力。这种文化塑造了OpenAI的产品形态,也决定了它的代码风格。
OpenAI的技术细节
在技术架构层面,OpenAI的核心代码托管在一个巨大的monorepo中,主要以Python为主。近年来,Rust服务的比重逐渐增加,此外也有一些Golang项目,通常用于处理网络代理这类系统级任务。这个庞杂的代码库带来的直观感受是:风格极不统一。你既会看到由Google十年老兵写出的、面向大规模系统设计的库,也会碰到刚刚入职的博士生丢进来的临时Jupyter笔记本。
在基础设施方面,OpenAI的一切都运行在Azure上。然而,OpenAI很少依赖Azure的自动伸缩服务或IAM权限系统,而是强烈偏好自研系统。能自己写的,尽量自己写。
工程团队中有不少成员来自Meta,尤其是Meta和Instagram的基础架构部门。这使得OpenAI在某种程度上有点像早期的Meta:一款现象级的消费级应用,配套基础设施还在建设中,团队渴望快速迭代。
另一个非常核心的架构特征是:“Chat架构深入骨髓”。自从ChatGPT爆红以来,大量代码围绕“聊天消息”与“对话”这两个概念进行组织,这些设计已经成为不可忽视的原语。如果在开发中忽视这些设计,后果可能很麻烦。
决策架构的过程也体现了OpenAI一贯的“行动偏好”:谁做,谁决定架构。这里没有架构委员会,也不太讲“自上而下”的计划,多数技术方案是哪个团队想做,就直接开干。这导致代码库里常常出现多个“重复造轮子”的场景,仅排队系统、Agent运行框架,Calvin就看到了五六种不同的方法造出类似的结果。
这种快速增长并非没有代价。有些系统因此变得混乱,即使是顶级的AI公司,在快速扩张时也会遇到常见的工程问题。
在技术架构的框架之上,Calvin最重要的项目是参与Codex的落地与发布。在他离职前的最后三个月里,Codex的冲刺成了他职业生涯的一大高光时刻。2024年11月,OpenAI正式定下2025年的产品目标:推出一款coding agent。到2025年2月,内部已经出现了一些使用模型进行编程任务的工具,效果相当不错。但随着越来越多的agent工具问世,OpenAI内部感受到了外部压力,团队进入一种近乎狂奔的节奏。从第一行代码写下到产品上线,只用了7周时间。
Calvin回忆说,那段时间几乎每天都加班到深夜十一二点,凌晨五点半被刚出生的孩子叫醒,七点又准时出现在办公室,周末也不例外。整个团队拼尽全力,Calvin说:“这家公司,还有那股冲劲儿。”
在七周的时间里,8位资深工程师、4位研究员、2位设计师、2位市场与销售成员以及1位产品经理,共同打造出了一个可发布、可上线、可直接使用的AI编程Agent。
发布前夜,五个人熬到凌晨四点部署主服务,紧接着清晨八点又准时回到办公室,准备直播和公告上线。当时功能开关一打开,流量瞬间涌入。Calvin说,他从没见过一个产品仅仅是出现在ChatGPT左侧边栏,就能瞬间引发如此大量的用量,他称之为“这就是ChatGPT的力量”。
从怀疑到收获
在回顾这一年时,Calvin承认,最初加入OpenAI时他其实是犹豫的。他不确定自己是否适合进入这样一家AI巨头,甚至为了预留退路,他在刚加入时对外保持了相当低调。但他为自己设下了三个在OpenAI想完成的目标:一是建立对模型训练与能力边界的直觉;二是和一群优秀的人共事并从中学习;三是发布一个真正打动人的产品。
现在回看,这一年无疑是他职业生涯中最重要的一段经历之一。他说,很难想象还有哪里能学到这么多。
这段经历也刷新了他对“大品牌”的理解。在参与Codex时他意识到,OpenAI所有的产品设计几乎都是围绕“Pro用户”展开的,哪怕是面向开发者的Codex,也主要以个人用户为导向,而非团队。这对来自B2B世界的他来说完全是另一种思维方式:ToC的开关一旦打开,流量立刻涌入,不像ToB的传统企业产品,还需要漫长的客户开发周期。
他也第一次站在一线,了解大模型是如何训练的。实验不只是算法问题,调数据、盯指标、调边缘案例,样样都得自己动手。而到了大规模训练时,每一次都像一场不可预知的系统挑战。
对于其他创业者,Calvin给出了两点建议:如果你感到自己创业的项目停滞不前,不妨认真考虑两个方向:要么更激进地出击、增加试错次数;要么加入顶级实验室,去亲眼见证未来是如何被构建的。
在他看来,通向AGI的竞赛已经进入三国演义:OpenAI、Anthropic和Google各自代表着不同的技术与文化路径:消费产品、企业服务、工程硬核。Calvin相信,进入其中任何一家,都会是一段眼界大开的经历,正如过去一年他的亲身经历。