AI应用战争,Sora打响了第一枪。当OpenAI在十一假期第一天发布Sora 2及其配套应用时,全球科技圈被彻底点燃。Sora App在严格的邀请制下,仍火速冲上美区下载榜第三。然而,喧嚣之下,争议也随之而来:这会是AI时代的TikTok,还是一个超级应用的诞生?还是又一个'现象级'的烟火,绚烂一瞬便迅速冷却?
通过与多位行业领袖的深入对话,我们逐渐看清Sora的真正价值——它不仅是一个技术突破,更是一场产品思维的革命,开启了AI原生的ToC应用时代。
Sora:AI原生超级APP的雏形
Sora的出现,让许多从业者感到震撼。Lovart创始人陈冕表示:'我是一个产品经理出身,最近十年里,能让我感到震撼的时刻只有三次:第一次是2016、17年玩抖音,第二次是2022年底玩ChatGPT,第三次就是这次的Sora。'
这种震撼源于Sora带来的双重突破:从技术角度看,它实现了音画同步、人物ID保持和多镜头叙事;从产品角度看,它成功解决了'AI+社交'这一长期困扰行业的大命题。
技术突破:三大核心能力
Sand.ai创始人曹越从技术视角解读了Sora的三点核心进步:
音画同步:当一个视频模型能同时生成画面和声音时,它就越过了C端消费的临界点。过去一年的视频模型大多只能生成无声的GIF式画面。
人物ID保持:Cameo功能同时锁定样貌和音色,让AI生成的内容具备了更强的可消费性和传播性。
叙事属性:生成的10秒视频包含运镜、多镜头切换(最多8个镜头)和景别设计,这是以往视频模型所不具备的能力。
这三种能力的结合,使Sora从单纯的'片段生成'进化到了'可消费的完整故事'生成,标志着AI视频技术的重要里程碑。
产品创新:社交驱动的交互设计
从产品角度看,Sora展现了'AI原生超级APP'的雏形。陈冕认为,Sora的创新主要体现在三个方面:
为产品打造模型:OpenAI这次想得非常清楚——它在为产品打造模型,而不是为模型找产品。这表明它不只想做一家模型公司,更想做一家消费互联网产品公司。
解决AI+社交难题:Sora的Cameo功能巧妙地解决了社交的乐趣建立在熟人关系之上的本质需求。你朋友圈的照片质量不一定高,但因为是你熟悉的人,所以感觉不一样。
低成本Remix共创:左右滑动交互本质上是一种低成本的再创作方式,AI降低了创作门槛,让普通用户也能轻松参与内容创作。
这些创新使Sora迅速登上美区App Store总榜第三,验证了其产品设计的成功。
为产品打造模型,而不是为模型寻找产品
Sora的成功,很大程度上归功于OpenAI展现出的强大垂直整合能力——组织内部同时拥有顶尖的模型能力和敏锐的产品洞察力,并且能让产品需求反过来指导模型的迭代方向。
组织能力的垂直整合
曹越指出:'OpenAI展现出了一种强大的垂直整合能力,即组织内部同时拥有顶尖的模型能力和敏锐的产品洞察力,并且能让产品需求反过来指导模型的迭代方向。'
这种组织能力并非一蹴而就。陈冕分析道:'Sam Altman是一位非研究员出身的CEO,他是一个顶级的'产品+融资+战略'大师。在过去几年由研究员主导的'模型竞赛'中,让一个纯研究员主导的公司率先做出顶级产品,是很难的。'
OpenAI的成功得益于其独特的组织结构:既拥有顶尖研究员,又由非研究员出身的顶尖产品战略大师领导;同时兼具创业公司的高融合度与巨头的雄厚资源。
产品思维的转变
Sora的出现,标志着行业话语权的转移。陈冕认为:'定义应用和产品的能力,其重要性正变得与构建模型同样重要。'
就在大家还在讨论OpenAI的模型领先优势是否缩小时,他们已经通过产品开启了下一阶段的竞争。底层模型的竞争格局已相对集中,但Sora的出现,就像当年的ChatGPT一样,正式拉开了AI应用层竞争的序幕。
极简的产品设计
Sora App的产品设计看似简单,实则蕴含着深厚的功力。陈冕评价道:'大家不要觉得一个产品看起来简单,越是简单的产品,背后越见功力。产品经理最难的不是做加法,而是做减法,这需要顶级的判断力。'
Sora App的交互就是最简单的上下滑、左右滑,创作流程也极其简练:用@来选择人物(Cameo),然后输入prompt,整个过程行云流水。它所有的设计都在鼓励用户进行社交互动。
超越技术:AI时代的组织护城河
Sora的成功不仅在于技术突破,更在于其背后强大的组织能力。在AI时代,如何构建有效的组织架构,成为企业竞争的关键。
视频生成技术的演进
回顾视频生成技术的发展历程,曹越梳理了几个关键里程碑:
Sora(2024年2月):用'扩散模型+Transformer'的结构证明了AI可以生成高质量的单镜头素材。
音画同步技术(2024年上半年):以Veo等模型为代表,让AI生成的人物表现力大增,跨越了'恐怖谷'。
自回归模型:如MAGI-1和Genie,像语言模型一样逐个Token生成视频,能生成更符合物理规律的视频。
Sora 2:核心叠加了'叙事能力',能一次性直出包含有意义镜头切换的短片。
物理准确性:官方通过体操、跳水等案例强调这一突破。
组织整合的必要性
在AI时代,产品和模型的边界变得模糊,这对组织提出了新的要求。陈冕分享道:'一个产品经理会从用户出发,想着用现有技术去'打补丁',比如优化提示词。但我们的技术同学会提出一个更未来的概念:为什么整个画布不能是一个上下文窗口?'
这种跨职能的深度整合需要组织非常敏捷,没有部门墙。'根据我的经验,他们必须物理上坐在一起,因为'物理距离也影响心理距离'。我脑海里Sora的诞生画面就是:在一个复合型团队里,一个既懂模型又有产品感的人突然想到一个新玩法,然后整个团队能迅速形成共识并落地。'
曹越也强调了上下文对齐的重要性:'组织内部绝大多数的摩擦都来源于'上下文不对齐'。不同专业背景的人之间沟通带宽很窄,因此提升组织效率的本质,就是如何让大家更快速地对齐上下文。'
模型与产品的融合
AI时代,产品和模型的边界比以往更加模糊。曹越指出:'AI时代,产品和模型的边界比我想象的要模糊得多。这对组织的要求是:做产品的人要去理解模型,做算法的人也要和产品的人多交流。'
这种融合不是简单的协作,而是深度的认知共享。'很多伟大的想法不是设计出来的,而是碰撞出来的。组织就像一个容器,把不同背景的人'Remix'在一起,最终产生伟大的创意。'
AI应用的黄金时代和'最卷'的战场
Sora的出现,不仅是一个产品或技术的突破,更标志着AI应用黄金时代的到来。然而,机遇与挑战并存,创业者面临着前所未有的竞争压力。
AI原生的思维转变
陈冕提出了一个关键概念:'AI时代最大的机会,本质上是AI原生的机会。'
如何定义AI原生?'你就想,没有AI,这个业务或内容还存不存在?如果不存在,它就是AI原生的。这是一个很重要的思维切换。如果你想在AI时代做一家伟大的公司,就必须回答这个问题。如果答案是'体验会打折',那你可能做错了;如果答案是'业务会直接消失',那你就做对了。'
这种思维转变意味着,创业者不能仅仅将AI视为提高效率的工具,而应该思考如何利用AI创造全新的体验和内容。'所以我其实不认为未来会是'好莱坞大片人人都能拍'。当年抖音出来,大家以为短视频是另一种电影,后来发现它是生活记录视频,是摄像头的平权化。我觉得这次也会是不同的东西。'
供给端的变革
曹越从供给角度分析了AI带来的变革:'这一波AI本质上是一场生产力革命。无论是语言模型、图像视频模型,还是现在可以音画同步生成的模型,它们在初始阶段都是在改变供给。'
关键问题是:到底要改变的是什么供给?'以视频为例,过去一两年我最大的感受就是,视频这个品类实在太庞杂了。有电影、短视频、中视频,甚至游戏也可以看作是一种交互式视频。'
随着模型能力的进化,机会也在不断演变:'一开始可能是人利用各种模型工具去制作一个片子;现在,一个模型已经可以端到端地生成一个10秒的短片。再过一两年,模型能独立生成多长的、可消费性的内容呢?'
创业者的机遇与挑战
Sora的出现,对中国的创业团队意味着什么?陈冕认为有两个方向的变化:
'首先是积极的一面:AI ToC的想象空间被极大地拓宽了。创业者能探索的方向更多,能做的事情也更多。光有模型能力已经不够,需要更复合的能力加入,这对创业公司是利好。'
'但另一方面,也存在'要么做大,要么出局'(go big or go home)的问题,即头部集中会更明显。因为行业发展太快,竞争趋于白热化。虽然巨头如OpenAI也并非无所不能——比如他们的Agent体验就不一定比创业公司好——但速度、资本和人才的密集,导致大家都在烧钱。'
曹越则对未来持乐观态度:'我对未来非常非常乐观。无论Sora是否出现,这个时代都充满了层出不穷的机会。我非常认同陈冕的观点,这是一个有巨大增量的时代。从底层来看,这波AI带来了至少几个数量级以上的效率提升,这种基础生产力的变革最终会催生出极多的机会。'
全球化视野
曹越还特别指出,中国的创业者完全可以放眼全球市场:'回顾过去,00到10年,大家主要聚焦中国市场;10到20年,顶尖的企业家已经在中国和海外市场都取得了成功。而在这个新时代,趋势一定会更加全球化。我相信,中国的工程师红利和企业家精神红利,能为世界创造巨大的价值。'
未来展望:AI原生应用的无限可能
站在Sora的肩膀上,我们不禁思考:AI原生应用将如何发展?创业者又该如何把握这一波浪潮?
技术演进方向
从技术角度看,AI视频生成还有很长的路要走。曹越透露:'我们最新的音画同出模型,将在国庆后大家就可以使用了。Sora让大家看到了音画同出最终的ToC机会是什么。'
未来,AI视频技术可能会向更长叙事、更高交互性方向发展:'沿着这个时间线推演,会涌现出不同类型的机会。它可能是一种像表情包一样的玩梗视频,也可能是需要更长叙事的AI短剧,还可能是有更多交互的形态,比如交互式游戏,用户可以点选分支剧情。'
产品创新空间
陈冕认为,AI原生产品的创新空间还远未被充分挖掘:'对Lovart来说,Sora对生产力侧是巨大的变化。之前Nano Banana出现时,我们的流量翻了一倍,希望Sora 2开放API后能再翻一倍。生产端工具的PMF已经得到验证,并且会更强,我们肯定不能错过这个机会。'
同时,Lovart也将激进地探索ToC领域:'我们会激进地探索ToC,但具体做什么我先卖个关子。如果一个产品能瞬间爆发,那可能还是大厂的机会。'
行业竞争格局
Sora的出现,可能会重塑整个行业的竞争格局。陈冕预测:'国内的互联网大厂现在应该睡不着觉了。大家对Sora有个误解,它不是'AI版的抖音',而是'AI版的Instagram/朋友圈',它的本质是AI社交。'
在中国,通用社交有极强的头部效应和网络效应,赢家通吃,比如微信。'如果Sora真的做成了社交超级App,将会动摇现有所有平台的流量根基。这会引发一场'腥风血雨',无论是海外的Meta、Google,还是中国的几家大厂,都会疯狂内卷。'
创业者的行动建议
面对这样的竞争格局,创业者该如何行动?陈冕给出了三点建议:
勇敢地做ToC:Sora掀开了AI面向泛C端的帷幕,这件事可以开始认真考虑了。
加强组织能力的垂直整合:未来的组织,产品需要懂技术,技术也需要懂产品。不同职能的人,包括研究、工程、产品,必须深度整合。
Go big or go home:AI时代的机会比互联网时代大10倍甚至100倍,但市场也可能更加头部集中。业务要更激进地增长。
曹越也强调了组织敏捷性的重要性:'AI时代,产品和模型的边界比我想象的要模糊得多。这对组织的要求是:做产品的人要去理解模型,做算法的人也要和产品的人多交流。大家要多一起吃饭、散步,在非正式的沟通中对齐上下文。'
结语:AI原生应用的新时代
Sora的发布,不仅是一个技术突破,更是一场产品思维的革命。它标志着AI从单纯的技术工具,转变为创造全新体验的载体。正如陈冕所言:'ChatGPT开启了以模型为中心的时代,而Sora则开启了一个应用的时代,尤其是一个ToC应用的时代,这是里程碑式的。'
在这个AI原生应用的新时代,创业者面临的挑战与机遇并存。一方面,'Go Big or Go Home'的竞争态势要求企业必须快速做大做强;另一方面,AI带来的巨大增量空间也为创新提供了无限可能。
未来,那些能够将顶尖产品创意与模型深度整合、并全身心投入于创造全新体验的玩家,才能最终定义下一个时代。而Sora,只是这场革命的开始。