在机器人技术领域,人形机器人一直是备受关注的焦点。然而,当众多企业还在为展台上的亮相争夺眼球时,一家名为灵宝 CASBOT 的公司却悄然获得了一笔来自工厂的巨额投资。这笔近亿元的融资,由蓝思科技领投,天津佳益及老股东国投创合、河南资产跟投,无疑为人形机器人的发展注入了新的动力。
与以往风投机构的投资不同,这次的资金来自于真正需要解决产线痛点的“工厂派”。领投方蓝思科技在投资灵宝 CASBOT 之前,已经投资了智元机器人,这足以表明其对人形机器人在工业领域应用前景的看好。那么,人形机器人究竟是噱头,还是能够真正实现大规模落地?
在风险投资机构还在忙于计算估值模型时,生产线似乎已经给出了更为直接和诚实的答案。在 2025 年机器人技术迎来爆发式增长后,许多双足人形机器人开始聚焦于展览和教育等场景。而灵宝 CASBOT 则选择了一条相对独特的路径:减少对聚光灯下展示的关注,而是将目光投向工厂车间、矿山井下等对机器人存在刚性需求的场景。
随着工厂派投资人开始下场押注具身智能,一个更加尖锐的问题浮出水面:为什么工业场景仍然是少数玩家的蓝海战场?为了探寻具身智能在工业场景中的生存真相,我们与灵宝 CASBOT 的联合创始人兼首席运营官张淼进行了一次深入的对话。
工业场景:真需求与技术高墙
机器人在工业场景中是否真的存在需求?张淼给出了肯定的回答:“工业场景的需求是真实存在的。”灵宝 CASBOT 此前已经与联想公司的消费电子工厂以及本次投资方蓝思科技等多家消费电子工厂展开了合作。
张淼解释说,3C 产品的品类切换非常频繁,但单个品类的生产体量又相对较小,这就要求生产线必须具备足够的“柔性”,不能是固定的一次性重投入。目前,质检环节仍然主要依靠质检工人。工厂并非没有考虑过其他的解决方案,但要么是专用质检设备成本高昂,且“专机专用”的属性使其在品类频繁更换时显得有些鸡肋;要么是传统的固定机械臂,虽然成本较低,但却无法胜任需要手眼脑协同,且具备一定泛化抓取和操作能力的复杂任务。
如果拥有通用操作能力的具身机器人能够承担工厂的部分操作任务,将对工厂实现柔性生产和节约成本产生重要意义。矿山场景也存在同样的需求,但这里的需求更为刚性,驱动力也超越了单纯的成本考量。根据国家矿山安全局的指导意见,到 2026 年底前实现“危重岗位机器换人”是许多央企和国企面临的硬性指标,这构成了不容置疑的“政策刚需”。
井下作业环境非常恶劣,深入地下数百米甚至数千米,常年面临 30-40°C 的高温高湿环境,空气中还可能弥漫着有毒气体。因此,机器换人是对人类生命的根本关怀。
然而,尽管需求真实存在,但机器人换人仍然是一个绝对的蓝海市场,原因在于技术和 ROI(投资回报率)这两道高墙的阻碍。
首先是技术方面。理论上,如今的大模型已经能够理解人类的复杂指令,并进行一定的泛化操作。但在物理世界中,“灵巧手”的能力瓶颈限制了绝大部分替代可能。张淼举例说,比如给 3C 产品撕掉一层精细的背贴,或是理顺一把纷乱的线束,这些人类习以为常的动作,对于机器人来说仍然是巨大的挑战。
目前灵巧手本身还无法达到人类操作的精细度,需要等待触觉传感、算法、模型和手的构型一同进步。当前的技术边界大致如此:类似“插拔内存条、拧螺丝”这类相对规整的装配任务,机器人或许可以勉强完成。而矿井环境则在操作之上,又叠加了“本安防爆、抗尘耐用”等一系列严苛的工程化要求,机器人本身必须经过本安、抗爆、防尘等一系列特种改造,从而提出了更高的技术要求。
其次是 ROI 方面。即使需求再真实,工业客户的每一笔采购仍然遵循严格的商业回报逻辑。工业客户从不为情怀买单。张淼坦言,许多客户的需求非常明确:“必须在 12 到 18 个月内收回机器人采购的成本。”这条清晰的商业红线,考验的不仅是机器人的售价和效率,更考验着机器人公司对工业流程的理解和成本控制能力。而如何与客户共同定义场景、核算并达成这笔“经济账”,恰恰是工业场景的另一重隐形门槛。这或许是技术储备夯实同时又具备丰富工业场景交付经验的灵宝 CASBOT 团队所拥有的独特竞争优势。用他们的话说,“我们更会和工业制造企业打交道,讲好这本技术与商业结合的账。”
灵宝二代:量产解法与成本重构
面对工业客户“12-18 个月必须回本”的冰冷标尺,任何无法被清晰量化的技术情怀都显得苍白无力。灵宝给出的解决方案是,在 2025 年 6 月 16 日发布的第二代机器人 CASBOT 02 上,进行一场彻底的、由商业化需求反推的“成本与智能重构”。其中,最核心的改变是对机身进行了“骨架与外壳分离”的模块化、解耦化设计。
张淼表示,将复杂的整机结构“解耦”为独立的骨架和外壳模块,不仅显著降低了整机成本和重量,更重要的是,它极大地提升了“装机效率”,为即将到来的小规模量产交付铺平了道路。此外,借助本轮领投方蓝思科技在供应链上的深厚积累,其成本还有进一步优化的空间。
目前,CASBOT 02 在京东官方售价为 32.88 万元,精准地位于行业主流价格带的中段——向下与 20 万元级别的简配机型拉开能力差距,向上则避开了 50 万元以上的进口或纯科研型号,使其具备了进入大部分 B 端及一些 C 端爱好者采购清单的现实可能性。
此外,虽然主要针对工业场景,灵宝 CASBOT 02 也针对目前需求很大的展览文旅场景做了一定的优化,增加了灵动模式——机器人在不工作的时候,也会做出一些类人的思考和举动,增加和用户互动的趣味性。除了本体的优化之外,灵宝团队也在算法上做了升级。团队发现,单纯的 VLA 模型在面对工业精细化操作时存在性能瓶颈。为此,他们在 VLA 模型之上,创新性地加入了“离线-在线两步微调”方法,特别是在线阶段引入强化学习,让机器人能够在与真实环境的交互反馈中不断优化策略。
同时,其核心优势的灵巧手算法也进行了迭代升级。与行业内的机器人相比,灵宝的机器人背后的软件算法有几个与众不同的地方。其一是名为“分层端到端”的实用架构。将负责核心任务、可在本地独立运行的“端侧具身模型”,与负责开放式交互、部署在云端的“云侧大模型”分离开。这保证了机器人在网络不佳的工厂能够稳定作业,在需要交流的商场又可以“连上云”对答如流。
其二则在于数据。在具身智能的赛道上,数据是模型的血液。目前行业内许多公司使用“真机遥操作”的数据采集模式。张淼表示,这种路径有其自身的问题:为了保证数据质量,操作员会下意识地把一个不到 1 秒的动作,放慢到好几秒来完成。而用这种失真的慢数据去训练模型,产出的机器人效率只有人类的 30%,这也是为什么很多演示视频需要加速播放的原因,这并不适用于工厂场景。
灵宝的解决方案是让“人类自己当教练”——他们与中国科学院自动化研究所联合研发了一套“真人域”数据采集系统(带有密集触觉传感器的手套和视觉眼镜),由工程师真人佩戴,以最自然高效的方式完成任务,从源头上保证了数据的高质量与“原汁原味”。
在完成了智能与成本的双重进化后,灵宝清晰的量产交付计划也浮出水面,其商业路径并非单押双足。灵宝机器人今年也参加了人形机器人马拉松比赛,虽然并未进入前三,但是是场上唯一零失误、零摔倒的机器人。张淼表示,公司对双足的规划,更像是“能够满足多地形通过”即可。而未来,公司布局了全尺寸双足、轮式机器人、以及可独立销售的灵巧手三条产品线。
“我们今年的目标,是在三条产品线上分别完成小规模的量产交付,每条线的量级大约在 100 台套左右。”张淼最后强调,“我们的量产,唯一的目标就是为了真实的订单交付。没有客户买单,盲目量产没有意义。”
随着技术的不断进步和成本的逐步降低,我们有理由相信,人形机器人将在工业领域迎来更加广阔的发展前景。而像灵宝 CASBOT 这样,真正从客户需求出发,不断创新和突破的企业,必将在未来的竞争中脱颖而出。