当李飞飞指明空间智能是 AI 的下一站时,行业才猛然发现,通往这一站最关键的「数据船票」,其实早就握在了这位行业老兵手中。
空间智能:AI 进化的必然方向
2024年,李飞飞的「空间智能」(Spatial Intelligence)无疑是科技圈最性感的词汇之一。这位 AI 教母的振臂一呼,让原本还在卷文本、卷视频生成的行业目光,瞬间被拉向了 3D 世界。然而,这个领域太过前沿,以至于在大洋彼岸,除了李飞飞的 World Labs,真正能看懂并跟进的玩家也寥寥无几。
在中国,谁会是那个最快跟进的人?
令人意外的是,答案或许不在那些声量巨大的大模型独角兽名单里,而是一家在装修设计领域耕耘多年的老兵——群核科技(酷家乐母公司)。
12 月 9 日,在群核科技 2025 酷+大会上,这家在 3D 空间领域深耕 14 年的公司宣布了一项重大战略升级:从 3D 软件提供商,转型为空间智能基础设施提供商。发布了物理模拟视频生成模型 LuxReal,并同步推出了 Aholo 空间智能开放平台,一口气开放了从空间重建、生成,到编辑与理解的全套能力。
虽然并非传统意义上的 AI Native 公司,但群核科技似乎正在走出一条独特的「中国版李飞飞路线」。
看起来或许有点反直觉:为什么率先在这条赛道交卷的,不是那些算力雄厚的通用大模型巨头,而是这家垂直软件公司?
答案藏在空间智能的特性里。空间智能的门槛不仅仅是算力,更是这种对物理世界的「显式掌握」。
在过去的 14 年里,群核科技积累了全中国最庞大的真实户型数据库、带有精确物理材质参数的商品模型,以及数以亿计经过渲染验证的装修方案。这些并非合成数据,而是物理世界的「数字底稿」。
中国的「李飞飞路线」:在黑盒中植入「把手」
在这次发布会中,承载群核科技空间智能野心的核心产品,是一个名为 LuxReal 的视频生成模型。
如果仅仅看演示 demo,LuxReal 似乎是在做与 Sora、或者李飞飞的 World Labs 类似的事情:输入一个图片,生成一段与图片相关的,物理规律准确且具有一致性的视频。但如果揭开引擎盖,你会发现几者的技术底色截然不同。
首先是 Sora 代表的「大力出奇迹」路线。Sora 本质上是一个「2D 原生」的模型。它并不真正理解三维空间,而是通过 DiT(Diffusion Transformer)架构,学习了海量视频数据中「像素块」的运动规律。它像是一个看过几亿部电影的天才画家,因为它知道「杯子掉落」后下一帧画面通常是什么样,所以它能画出符合物理直觉的视频。但这种物理规律是「涌现」的,是不稳定的——这也是为什么 Sora 生成的视频中,人有时候会突然长出第三只手,或者椅子在旋转时会莫名变形。因为它心中没有「椅子」的三维模型,只有「看起来像椅子的像素」。
而群核科技与李飞飞的 World Labs,则站在了 Sora 的对立面。两者都坚信:要解决物理一致性,中间必须多一步三维几何结构,就是所谓世界模型的路线。也就是不能直接从 Text 变 Video,必须是 Text -> 3D World -> Video。只有先在计算机里构建出一个有深度、有体积的 3D 舞台,再在这个舞台上架设虚拟摄像机拍摄,才能保证无论怎么运镜,物体都不会崩坏。
但就在「如何构建这个 3D 舞台」这一步上,群核科技和李飞飞的路线略有不同。
李飞飞试图构建一个「可学习的渲染器」。在这个模型中,AI 不需要构建任何显式的 3D 模型。它将世界压缩进了神经网络的「激活状态」(KV Cache)里——这是一个人类看不见、摸不着的「隐式世界」。通过端到端训练,模型学会了像上帝一样在神经元内部「渲染」光影、反射和遮挡。它模糊了「重建」与「生成」的界限:给它几张图,它就能在脑海中补全这个场景的各个角度。它极其优雅,像是一个看过世界的「缸中之脑」,在思维内部完美模拟了物理法则。

而群核科技的 LuxReal,选择了一条更「笨」但对产业更有用的路:基于资产的结构化生成。
得益于 14 年的积累,群核不需要让 AI 在神经元里去「隐式模拟」一个沙发。LuxReal 以群核自研的 Lux3D 为底座,它的工作流是:先生成 3D:它是生成式 AI,但它首先生成的是 3D 物体和场景;再渲染视频:有了确定的 3D 资产后,再通过物理引擎将其渲染成视频。
因为中间多了一步「显式」的 3D 支撑,无论镜头怎么甩,高达的模型结构被牢牢锁死,绝不可能出现「长出第三只手」或「金属变液体」的幻觉。
而群核之所以敢选这条路,底气依然在于他们的数据积累。要训练 AI 进行精准的「显式表征」,需要海量带有精确物理标注的 3D 数据作为「教材」。这正是群核科技过去十四年构建的护城河——他们不需要像其他公司那样用游戏引擎去合成数据,他们手里就有最真实的物理世界数字底稿。
这个多出来的「显式步骤」,它在处理流体与极端形变时,或许不如李飞飞的隐式模型那般写意,相对来说也带来了额外的算力负载。但这恰恰是群核的取舍之道——通过支付这些成本,他们在 AI 那深不可测的黑盒中,成功植入了一个可供人类精准操作的「把手」。
它在处理刚体(Rigid Body)、结构化场景和复杂的室内光影时展现出了极强的优势。它少了一些无中生有的「幻觉」,却多了一份产业急需的「确定性」和「可编辑性」。
这在电商与广告场景中极具杀伤力。试想,当你上传一款新发布的咖啡机模型,你需要的是它在各种高级光影下流转,展示其金属质感,而不是让 AI 发挥想象力把它的按钮位置改了,或者把机身扭曲了。相比于其他模型容易「二创」产品,LuxReal 能做到「产品 100% 还原,而光影与运镜无限生成」。

这才是从「看着好玩」的 Demo,走向「所见即所卖」的 Commercial(商业交付)的关键一步。
意外的 3D 时代富矿
为什么在中国追赶李飞飞路线的,反而是群核科技?
要回答这个问题,我们需要把时钟拨回十四年前。那时候,群核科技(及其核心产品酷家乐)在大多数人眼中的形象,仅仅是一个好用的 SaaS 工具。它让设计师扔掉了难学的 3D Max,在浏览器里就能快速搭建户型、渲染效果图。
彼时,没有人能预见到 2024 年的 AI 变局。群核自己可能也没想到,当年为了「让装修变简单」而建立的这套云端 CAD 系统,竟在十四年的漫长岁月中,无意间通过数千万设计师的手,堆出了一座全世界最大的、真实物理世界的数字富矿。
这便是空间智能赛道上最反直觉的一幕:当硅谷的顶尖头脑们为了获取高质量 3D 数据而绞尽脑汁时,这家中国垂直软件公司,却坐在了金山上。
在空间智能的训练中,数据决定了天花板。
即便是李飞飞的 World Labs,或者是其他试图冲击 3D 世界模型的大厂,在缺乏真实数据的情况下,往往只能退而求其次——利用 Unity 或 Unreal 等游戏引擎来生成「合成数据」(Synthetic Data)。
这在逻辑上是通的,但存在致命的 Sim2Real(从仿真到真实)鸿沟。游戏引擎生成的场景是完美的、干净的、人工定义的。然而,真实的物理世界是「脏」的、复杂的、充满噪声的。完全用合成数据训练出来的 AI,在面对真实世界时往往会「水土不服」。
而群核科技手里握着的,是真正的「物理底稿」。
过去 14 年,中国几乎每一次装修浪潮、每一套奇葩户型的改造、每一个家具的摆放逻辑,都被数字化地保存在了群核的服务器里。
这里有数亿张真实的户型图,涵盖了中国大江南北最复杂的建筑结构;这里有海量带有精确物理参数(材质、摩擦力、尺寸)的商品模型,而不是只有外壳的 3D 贴图;这里还有数不清的设计方案,它们不是随机生成的,而是包含了人类设计师对于「什么家具应该放在哪里」的深度语义理解。
这些数据不是为了 AI 专门造出来的,它们是真实业务长出来的。正是这种「原本为了产业应用而积累的高精度数据」,构成了群核科技最深的护城河。它比通用的视频数据更深(有结构),比游戏引擎的数据更真(有物理属性)。
一转头,群核科技发现自己正坐在这一轮 AI 竞赛最稀缺的资源——数据金山上。
这种资产层面的底气,直接推动了公司战略维度的跃迁:从一家垂直的 3D 软件提供商,正式转型为空间智能的基础设施服务商。
12 月 9 日,群核科技正式发布 Aholo 空间智能开放平台。这不只是发布了一个工具箱,更是一次彻底的「家底开放」。群核将过去 14 年在 3D 领域打磨最深的四项核心能力——空间重建、空间生成、空间编辑、空间理解——毫无保留地进行了系统性封装并对外输出。
这是一个极其关键的战略转身。在此之前,这些能力主要服务于家居装修行业的内部提效;而现在,通过 Aholo,群核试图将这些能力变成 AI 时代的「水电煤」:
- 空间重建:让单张 2D 图片瞬间「升维」,变成可漫游、有深度的 3D 场景;

- 空间生成:用自然语言描述就能「生长」出复杂的 3D 模型;
- 空间编辑:这是群核最擅长的「显式」能力,让生成的 3D 不再是死板的像素,而是可被精准修改的资产;
- 空间理解:让 AI 真正看懂画面里的物体关系,知道「椅子在桌子旁边」不仅是像素的位置,更是语义的关联。
如果说 LuxReal 是为了让人类看到更逼真的视频,那么 Aholo 开放平台的野心则更进一步——它想让机器看懂世界。
在这次发布中,一个不起眼但极具想象力的信号是:群核科技正在发力具身智能(Embodied AI)。
这也是「空间理解」能力最性感的落地场景。过去的机器人(如扫地机或服务机器人)在室内导航时,往往是个「瞎子」或者「高度近视」。它们依靠激光雷达避障,虽然能测距,却不懂环境的语义——它们不知道前面这堆像素究竟是「昂贵的玻璃瓶」还是「耐撞的承重墙」。
群核科技正在尝试将其海量的 3D 资产和场景理解能力,投喂给机器人。通过学习群核数据库中成千上万种真实的室内布局和物品摆放逻辑,机器人可以获得一种「上帝视角」般的先验知识。龙天泽透露,群核已经在做机器人导航中的 3D 物品视觉理解。这意味着,未来的机器人不仅能「看见」障碍物,还能通过接入 Aholo 的模型,瞬间做出判断:
「这是易碎品,必须绕行 20 厘米。」
「这是柔软的沙发,可以紧贴着走。」
从服务设计师,到服务机器人,群核科技的数据价值,正在发生一场从「画图」到「识途」的质变。
摸着李飞飞过河
对于群核科技来说,「空间智能」既是一次站在风口上的顺势而为,也是一次略带遗憾的「迟来觉醒」。
在发布会后的交流中,团队内部流露一种真实的紧迫感,甚至有一种声音感叹:「要是早知道,去年就该发力做了。」
这种遗憾背后,其实是对 AI 技术代际演进的深刻复盘。当大模型从文本(Text)卷向图像(Image),再到视频(Video),行业终于意识到,下一站必然是 3D,是物理世界。群核科技猛然发现,自己手里那些原本只用于装修设计的图纸和模型,在新的 AGI 语境下,突然变成了一张通往物理侧人工智能的昂贵门票。
这种冲击不仅发生在技术层,更直接撼动了商业模式的底层逻辑。
陈航(群核科技 CEO)透露,随着 AI 产品的推出,传统的 SaaS 售卖方式正在失效。以前,软件是按 Seat(坐席)收费的,逻辑是「人」在使用;但现在,调用场景变成了「人机混用」,机器调用的频次可能比人高出几个数量级。
「如果只按年费、月费收费,机器一调用就被拉爆了。但如果只按 Token 或 Credit 充值,准入门槛又太低,无法筛选高质量客户。」陈航说道。
为了适应这个新时代,群核正在摸索一种「年费/月费 + Token/Credit」的混合计费模式。这不仅是计费方式的调整,更是对软件价值定义的重构——从卖「工具的使用权」,转向卖「算力与智能的消耗量」。
当然,陈航也表现出了难得的清醒。他坦言,国内市场对 AI 产品的付费验证周期相对较长,「让客户在原有预算之外再花额外的钱,是很难的,必须要验证绝对的价值。」
他们坦言,关于未来具体怎么走,商业模式是卖 API、卖模型还是做新的超级应用,目前并没有百分之百的定论。这更像是一场「摸着石头过河」的冒险,只不过这一次,河对岸多了一个明确的灯塔——李飞飞。
「摸着李飞飞过河」,不仅仅是一句玩笑,它有着双重含义:
一方面,是方向上的确认。李飞飞和 World Labs 的存在,证明了「空间智能」不是一个伪命题,而是 AI 进化的必经之路。这给了群核科技巨大的信心,去重仓投入这个原本只有他们在做的冷门领域。
另一方面,是路径上的独立。群核没有盲目照搬硅谷的纯科研模式,而是结合中国产业的土壤,利用自己独有的「显式数据」壁垒,走出了一条更注重可控性、更强调产业落地的差异化路线。
对于群核科技而言,这条河刚刚过了一半。水深水浅,唯有自知。
但至少,在通往物理世界 AI 的这艘大船上,他们已经不再是岸上的旁观者,而是手握罗盘与燃料的核心玩家。未来或许充满不确定性,但对于一家拥有 14 年数据底蕴的公司来说,没有什么比「正在场上」更重要的事情了。

