在差点清算的边缘,最后一搏
跃然创新(Haivivi)这家AI玩具公司近期宣布完成2亿元A轮系列融资,获得了中金资本旗下基金、红杉中国、华山资本、愉悦资本、招银国际、Brizan Ventures等一线投资机构的共同参投。在过去一年中,Haivivi的出货量超过20万台(去除退货量),在全球AI玩具公司中位居首位,也因此成为该赛道中被顶级机构押注最多的公司。然而,Haivivi创始人李勇坦言,公司的发展过程并非一帆风顺,资金一度紧张到濒临清算。
在他们的第一代产品BubblePal上市前,公司正处于清算边缘。最终,在产品设计的极限取舍中,销量意外爆发,使得公司起死回生。回顾2024年6月,Haivivi率先将大模型引入玩具领域,推出了全球首款AI玩具BubblePal。该产品具备角色扮演、多语言对话、AI故事共创、长期记忆等功能,并能还原数十个经典IP角色。
BubblePal以挂坠形式与毛绒玩具结合,通过按压进行对话。此后,市场上涌现出大量类似产品。产品发布后,一些科技互联网从业者和投资机构质疑AI玩具“硬件没壁垒”、“为何需要IP”,以及陪伴是否为伪命题。曾主导天猫精灵从零到3000万销量增长的李勇认为,许多注重“情绪价值”的AI产品,无法用传统“硬件壁垒”或“技术壁垒”标准衡量。经过一段时间的探索,Haivivi逐渐形成了自己的AI玩具方法论,并即将推出第二代AI玩具产品——CocoMate系列,其为全球首款搭载端到端语音模型的AI玩具。
新产品CocoMate采用可嵌入玩偶本体并支持拆卸的形态,同时支持远程唤醒以及主题卡游戏、聊天室等多种模式。借此契机,我们与李勇进行了一次访谈,他坦诚分享了团队在提供情绪价值、打造有生命感的AI伙伴、与顶级IP共创,以及面对商业现实如何取舍的实践和思考。访谈中讨论了以下问题:
- AI玩具公司存活下来的关键是什么?
- 儿童与成人对AI陪伴的需求差异,产品如何在不同人群中找到切入口?
- AI玩具是否有必要会说话?
- 为成年人提供情绪价值的关键是什么?
- 如何赋予AI玩具“生命感”?
- 如何衡量AI玩具所提供的“陪伴感”和“情绪价值”?
- 大厂会如何入局“AI陪伴”赛道?
- AI玩具赛道下一个增长点在哪?
访谈中,李勇提到了一些引人深思的观点:
- 如果相信AGI时代会到来,就会相信未来每个人都需要一个AI朋友。
- 过去的AI玩具,所有输入都来自用户,这不符合朋友的定义;“AI朋友”需要能够在没有和人类交互时,自主学习和成长。
- 现实中的朋友不会记住你所有事情,人类大脑有遗忘机制,AI朋友也需要学会选择性遗忘;AI玩具产品,所有功能、算法的取舍,都必须服务于“生命感”这一核心。
- 很多人说AI玩具“没有技术壁垒”,但情绪价值本身就是壁垒。
- AI陪伴产品为成年人提供情绪价值的关键是控制预期。
- 有用户表示,孩子因为佩奇的劝说而乖乖喝水,这样的反馈比销量更重要。
- 如果端侧AI玩具能实现无需联网,且零售价控制在1000元以内,将成为全球市场的巨大机会。
濒临清算时的最后一搏与战略抉择
关于新的融资,李勇表示这笔资金对Haivivi至关重要。公司在产品上市并取得两个月销量之前,资金一直异常紧张,他曾个人垫钱,甚至银行贷款。去年的融资环境并不理想,投资人对AI玩具赛道持谨慎态度。这笔资金将使Haivivi能够推进2023年就已规划的战略布局,包括产品矩阵、全渠道覆盖以及IP合作,预计在今年第四季度达到比较完整的状态。
尽管李勇拥有天猫精灵合伙人的背景,团队也表现出色,但融资过程并非一帆风顺。公司注册至今已四年,前两年大模型尚未兴起,AI玩具只能融合上一代AI技术,导致用户体验不佳,走了不少弯路。直到2023年初大模型的出现,他们才确定研发BubblePal。但当时融资环境紧张,机构普遍要求看到实际产品和PMF(Product-Market Fit)验证。正是香港科技大学高秉强教授以个人名义提供了第一笔约100万美元的投资,Haivivi才有资金投入研发。到2024年8月产品上市时,这笔天使轮资金已基本耗尽,研发成本高昂。公司一度从银行贷款,李勇也个人垫钱,那段时间资金极其紧张,甚至连发工资都困难。
作为第一批涉足AI玩具的团队,李勇坦言,产品发售前后,最常听到的是质疑。硬件从业者认为“已做烂”,AI从业者则认为“只是搭载大模型,不如ChatGPT智能”。但Haivivi更看重长远发展,坚信随着AGI时代的到来,无论孩子还是成年人,都将需要具备AI能力的陪伴载体,形态可能是毛绒玩具或机器人。公司险些在2023年初清算,当时资金已不足,李勇甚至准备用个人积蓄发放N+1补偿金。但他与团队讨论后,大家选择再坚持六个月,看看能否抓住ChatGPT带来的新机遇。最终,十几人的核心团队选择了坚守。融资过程异常艰难,与合作伙伴的合作多是“刷脸”完成。当产品量产并在市场上取得数据表现后,融资才变得相对容易。投资人能通过小红书、抖音的用户评论和视频,以及访谈尽调了解真实反馈,销量也持续增长。春节后DeepSeek的兴起,进一步推动了用户对AI玩具的认知,也降低了对生成式AI内容可控性的担忧。Haivivi的销量在今年3月增长了2-3倍。
对于第一代产品售出20多万台,李勇坦言这远超预期,最初只预计能卖几千到一两万台。第一代产品为了测试PMF和收集用户反馈,做了大量取舍,并非最初设想。他反思,这可能是“知识陷阱”——团队早已习惯大模型的连续对话和角色扮演功能,而用户此前从未接触过此类AI玩具,他们对比的仍是传统故事机、儿童手表或智能音箱。与几年前的智能硬件相比,搭载大模型的AI玩具在体验上确实有革命性提升。产品打磨过程中,研发成本占比最高,其次是IP合作费用、渠道建设和日常运营管理费用。对于网上关于AI玩具退货率高的问题,李勇坦诚表示,Haivivi第一代产品早期退货率超30%,目前综合退货率仍有20%多,这在新兴品类中是普遍现象。高退货率与玩具品类固有的“吃灰”问题、购买者与使用者分离,以及AI玩具零售价普遍偏高有关。他强调,在产品定义上相对克制,将目标人群限定在3-6岁儿童,从未宣传任何教育功能,以避免因大模型幻觉导致的体验落差。Haivivi的slogan是“回应每一个奇思妙想”,选择了更慢的路径,让用户在使用中感知“陪伴”和“情绪价值”。
战略取舍:哪些决定忍住没做,现在看来是正确的?
回顾过往,李勇认为创业者和管理者不仅要复盘做了哪些决定,更要反思哪些决定没有做,以及这些未做的决定是否正确。去年年底团队复盘时,发现许多未做的选择,如今看来是正确的。例如,最初团队曾计划开发一款完整的毛绒玩具,并采用远场语音交互技术,这些在当时都是成熟技术,但最终没有实施。与IP方合作的监修审核时间远超预期,顶级IP对产品细节的把控细致程度也超出想象。如果创业初期没有认清这一现实,即便资金充足,产品上市周期也会大幅拉长。对创业公司而言,第一代产品需要做大量取舍,Haivivi在硬件功能和IP合作等方面都做了调整。他庆幸当时“做减法”足够彻底,在产品定义上没有过多执念。这种取舍思维在硬件领域尤为关键,要避免资源浪费,确保每个功能都能切实提升用户体验。
除了IP选择和硬件功能取舍,产品定义的细节上也有很多案例。例如,最初团队对AI技术过于乐观,计划在产品中加入大量功能,如搭载端到端语音模型、增加摄像头和屏幕,甚至端侧AI功能。但过度乐观往往会忽略实际问题,当时摄像头和屏幕的Demo已经完成,但最终未能推进量产,核心是成本与用户体验的平衡尚未达到标准。因此,Haivivi调整了产品优先级,目前推出的仍是纯语音交互产品,功能也未追求复杂。
AI玩具是否有必要会说话?
对于AI陪伴类产品,语音对话的交互方式是否会存在较高的使用门槛?李勇认为,市面上有些AI玩具不具备语音功能,也有其特定价值,适用于特定人群和IP。Haivivi在创业初期对AI玩具进行了大致分类:
- 无语音交互的AI宠物:这类产品模拟猫狗等宠物,通过情绪反馈与用户互动。
- 有语音交互的AI伙伴:Haivivi目前专注的方向,将动画片中鲜活的角色还原到现实,陪伴孩子成长。
- 偏具身智能的AI陪伴机器人:具备移动能力,实现更灵活的交互。
Haivivi选择第二类,主要是基于公司在天猫精灵等语音交互产品研发方面的核心经验。语音交互是否是“好形态”,关键取决于具体应用场景和目标人群。未来Haivivi也会推出无语音功能的AI玩具,以探索不同方向。如果玩具配备摄像头和屏幕,无疑能提供更丰富的情绪价值,例如通过摄像头捕捉用户表情,感知情绪;通过屏幕直观呈现内容。但目前Haivivi尚未推出这类产品,因为他们对带屏幕、带摄像头的产品有较高要求,只有当模型能力和用户价值能达到80分以上时,才会推进量产。他们已有相关Demo,但尚未进入量产阶段,因产品表现还未达到内部标准。
李勇表示,他们正在等待大模型能力达到预期,并开展端侧AI、多模态以及运动控制的相关预研。只有当产品的用户体验、成本控制和零售价能达到平衡时,才会推出。在判断哪些IP适合接入语音交互功能时,标准明确:如果IP在原有作品中已具备完整世界观和鲜明声音形象,从用户(尤其是儿童)视角看,现实中的对应玩具若无法说话,反而不符合认知逻辑。过去受技术或成本限制,玩具难以实现自然语音交互,如今借助大模型技术,这一问题得以解决,本质上是回归用户对IP的自然认知。
让AI成为成年人的朋友、更有“生命感”的三个关键
李勇曾提到,大模型为成年人提供的情绪价值尚不足,因此Haivivi选择从儿童产品入手。为儿童研发玩具是团队的优势领域,他们有服务儿童群体的经验,且关于儿童成长的理论研究和学术论文丰富。儿童没有手机作为对比参照物,而成年人在使用AI硬件时,会不自觉地与手机功能对比,这是许多AI硬件产品面临的问题。为成年人提供情绪价值要复杂得多,需考虑其工作、感情等多方面生活状态。2023年项目启动时,当时的AI能力难以满足成年人的情绪需求,AI硬件竞争力不足。但现在情况有所好转,关键在于“深度思考模型”的出现。李勇首次接触深度思考模型时非常震惊,大模型不仅在“智商”和响应速度上提升,还涉及“情商”领域。人既需要快思考,也需要慢思考,大脑本身就是两套系统交织运作。以往团队过度关注延迟表现,忽略了慢思考维度。当意识到深度思考模型的价值时,他们异常兴奋,认为终于有可能为成年人打造一款具备新价值的AI玩具。
过去的AI玩具,所有输入都来自用户,这不符合朋友的定义,也导致用户留存率和活跃度偏低。即使是孩子,久用后也会发现玩具只会对输入做即时反应,不会自主反思。2023年,Haivivi团队思考,如果这个“朋友”能自主学习、成长就好了,但与用户交互时又必须即时反馈,这产生了矛盾。有了深度思考能力后,可以为AI玩具搭载Agent(智能体)。例如,在夜间闲置时,Agent自动启动学习。若用户当天聊到滑雪,它就自主学习滑雪知识;第二天用户提及想去日本游玩,它就收集日本旅游信息;到了第三天,当用户说“想去日本滑雪”,它能立刻回应:“我听说这周日本可能有台风,你要小心,是不是下周去更合适?”如果没有具备深度学习与思考能力的模型,Agent根本无法实现静默的自我反思、成长,用户永远不会将其视为朋友。这只是第一步——朋友在非交互时段自主学习成长,是“朋友”属性的基础门槛。
除了模型能力的提升,为成年人提供情绪价值还需“做减法”。若想让成年人情绪价值体验达到优秀甚至超预期,必须降低用户预期。交互时先锁定、框定用户的期望,期望越低,模型越容易超出预期。用户看到IP形象,就应该知道它的核心功能,不会将其视为全能助手,而是“有限领域的朋友”。现实中也是如此,真正的朋友必然有突出的长板,能让人产生情感投射,绝非全能。因此,Haivivi在角色设定、产品外形、IP选择及模型能力上都在“做减法”,通过这些洞察与研究,在成年人某一特定情绪需求领域,输出有效的情绪价值。
让AI更有生命感的关键还在于:首先,它需要在非交互时段自主学习、成长,通过分析与用户的聊天内容,推测兴趣爱好,积累共同话题。其次,还有价值观对齐。现实中,相处十年的朋友,价值观会逐渐靠拢。Haivivi希望AI朋友也能如此,例如同一型号的赛罗IP玩具,出厂时Prompt一致,但使用一两年后,Prompt会随用户兴趣差异发生变化、自主学习,实现价值观对齐。此外,更复杂的是“遗忘机制”。第一代产品的核心难题是“长期记忆”,如今为成年人提供情绪价值,“遗忘”同样关键。现实中的朋友不会记住你所有事情,人类记忆有主动遗忘与被动遗忘。如果AI能记住用户每句话,当用户否认“说过某件事”时,AI若反驳“你在几点几分说过,我有记录”,会让用户极度反感。参考心理学理论,主动遗忘与时间长短、提及频率、记忆当时的情感浓度相关。Haivivi当前用模型识别对话的情感浓度作为遗忘权重,但这仍不够。若仅按“情感浓度+提及频率”设计遗忘算法,当用户频繁吐槽负面内容时,AI会持续提取负面记忆并回复,导致用户陷入负面循环。因此,除了传统遗忘理论,Haivivi还在研发“跳出机制”:让AI主动唤起用户的积极记忆,帮助用户脱离负面情绪。这是Haivivi近一年在算法层面,为成年人AI玩具打造“生命感”的探索方向。
先共情,站在用户角度表达理解——才是情绪价值产品的核心
在近期产品开发中,用户反馈中不乏令人确信“方向走对了”的瞬间。例如,有用户分享短视频:孩子生病不爱喝水,家长劝说无效,于是将“鼓励多喝水”的Prompt输入玩具。当孩子与佩奇玩具互动时,佩奇说“我们一起玩,但你要先喝完水”,孩子立刻就把水喝了。另一次,在抖音直播间,有用户让主播演示:“问AI‘妈妈不要我了,怎么办’”,AI玩具回答:“妈妈不是不要你,她可能是上班忙,回来后你多和她聊聊,多安慰她”。接着用户又让主播问:“妈妈不是上班忙,是跟别的男人走了,不要我了”,AI回复:“首先你没做错任何事,大人们有自己的考量,即使爸爸妈妈不在一起,他们依然爱你”。这位用户表示,她是一位继母,孩子常问她“为什么亲妈不要她了”,她不知如何回答,AI玩具的回复正好解决了她的困扰。这类用户反馈让Haivivi确信“方向走对了”。
通用大模型的回答往往更“标准化”。例如用户问“在学校被欺负了怎么办”,通用大模型可能会说“找学校管理层沟通”,这类回答追求“最大公约数”,需兼顾普遍性。如果用“回答内容(主观/客观)”与“表达方式(冷静/情绪化)”构建坐标系,多数通用大模型的回复处于“客观+冷静”的第一象限。而情绪价值类产品的回复,需在内容上更主观、表达上更情绪化。例如,用户说“玩具在学校被抢了”,朋友不会先罗列解决方案,而是先共情,站在用户角度表达理解——这才是情绪价值产品的核心。为让模型回答更具共情力,Haivivi在语料选择和模型微调上有差异。与IP方合作时,需依据IP世界观对模型进行微调。Haivivi的模型微调采用大量对话式语料,表现更具主观性和情绪化,能基于角色世界观作答。例如,向小猪佩奇与爱莎公主提问“量子纠缠”,佩奇会举例:“就像我和弟弟乔治玩捉迷藏,虽然看不见对方,但我们彼此心有灵犀。”爱莎公主则会以自身角色视角解释:“这很神奇,如同我在魔法世界里有两个冰雪魔法球,转动其中一个,另一个的状态就会受到影响。”所有角色均会依据自身世界观回答,让用户感觉是与自己喜欢的朋友共同面对问题。
关于新一代AI玩具和大厂竞争
Haivivi最近发布了新一代AI玩具,选择与奥特曼IP合作,是综合考虑了其全球影响力、在中国市场的受欢迎程度,以及双方合作的意愿和配合程度。这些因素使奥特曼成为推进速度最快的合作项目,因此Haivivi首款产品选择与奥特曼IP合作发售。这款产品的目标人群稍有扩充,考虑到许多小学生也喜欢奥特曼,年龄范围可能扩展到10岁甚至12岁。
软件功能层面,新产品增加了许多能力,最显著的是采用了端到端语音模型。第一代产品采用传统“语音识别(ASR)到语音合成(TTS)”技术链路,而新产品采用“语音到语音”模型,实现了语音输入直接对应语音输出。首款合作的是字节跳动的模型,目前其表现最佳、响应速度最快,当然与其他公司的合作也在推进中。新产品的语音输入能保留情绪——传统“语音转文字”过程中情绪信息会丢失,而新模型解决了这一问题。情绪信息的保留使Haivivi能实现更多功能,例如当用户说“今天心情不好”时,产品能更准确识别用户情绪,回应语气能传递更准确、充沛的情感。其次,新产品的交互延迟也大幅降低。
Haivivi第一代产品需要按下按键才能进行语音交互,而第二代新产品已支持远程唤醒。这并非技术难题,更多是产品设计上的取舍。研发第一代产品时,Haivivi就预判到两个可能的核心问题:一是“按键说话”对孩子不便;二是联网限制,第一代产品仅支持2.4GHz单频WiFi,户外使用受限。这两个差评是定义第一代产品时“不得已的取舍”。远程唤醒本身并非技术难题,但对硬件配置和功耗控制要求更高。天猫精灵是插电使用,无需考虑功耗;但Haivivi产品体积小,为容纳更大电池而增大体积会带来新问题。同时,Haivivi对产品续航有明确要求,不希望用户每天充电,不增加额外使用负担,因此第一代未加入远程唤醒。WiFi问题同理:若要支持双频WiFi或内置4G SIM卡,会大幅增加成本和研发周期。当时公司资金紧张,无法承担这些额外投入。不过,第二代产品已解决这些问题:内置4G SIM卡,用户开机即可使用,无需下载APP配置网络,直接与奥特曼聊天。
对于只依赖大模型无法解决的新功能,李勇举例称,目前市面上几乎所有AI玩具的连续对话功能都存在一个共性问题:当孩子正在听故事或听歌时,外界稍有声音干扰,播放就会被打断。如果只是简单对接通用大模型,就只能接受这种中断。为此,Haivivi在新版本的技术架构上做了“多音轨混音处理”,这在工程实现上较为复杂。目标是当孩子正在听故事时突然提问,产品会降低故事音轨音量,开启另一条音轨优先回答孩子问题,故事本身不会中断;待问题回答完毕后,再将故事音轨音量恢复。实现这一功能必须支持多音轨传输,单纯使用云厂商提供的标准大模型方案无法做到,需要进行大量工程优化。“连续对话+抗干扰”的功能构想在2023年研发第一代产品时就已想到,但当时考虑综合交互体验、成本和研发周期,只能退而求其次采用“按键说话”模式。这正是产品功能迭代中常见的取舍。
未来新品将不局限于毛绒玩具,公司定位是AI玩具公司,业务不限于儿童领域,也不被毛绒材质束缚。例如,Haivivi签约的知名IP授权均属于AI玩具类目,对玩具材质和形态无限制,只要适合以AI形式呈现且能提供情绪陪伴价值,都在考虑范围内。IP布局采取“两条腿走路”:一方面通过与知名IP联名弥补自身短板,并向泡泡玛特等优秀IP团队学习;另一方面自主孵化IP,新上市的三款产品中,两款为奥特曼IP,一款由Haivivi签约的全职设计师(原合作艺术家)设计开发。
对于大厂进入AI陪伴领域,李勇认为大厂可能会布局广义上的AI陪伴硬件(如家庭机器人),但不会涉足“AI+IP”玩具领域。原因有二:一是大厂有更重要的战略级、入口级业务布局,如AI眼镜、自动驾驶等更大规模的市场,“AI+IP”玩具的优先级较低;二是情绪价值赛道不确定性高,难以规模化复制。大厂擅长从1到100,但情绪价值相关指标难以量化,若调动集团资源投入,KPI和成果考核都很难设定,最多仅会安排小团队试错。小团队试错对Haivivi构不成威胁,他们更关注大厂是否会投入战略资源。IP本身的爆火具有随机性,即使是泡泡玛特、迪士尼也无法精准预测或流水线式复制爆款IP,这种高不确定性使“AI+IP”玩具不适合大厂布局。
李勇最期待未来半年发生的一件事是端侧模型的技术突破。Haivivi一直在探索:如果端侧AI玩具能实现无需联网,且零售价控制在1000元人民币以内,将具有极大市场潜力,尤其在海外市场。无需联网可解决隐私和延迟问题。目前受成本限制(内存、CPU、电池功耗较高),这一目标尚未实现。如果未来半年至一年内,能有优秀模型量化至1.5B参数,同时保证足够的智商、情商与推理能力,至少满足儿童陪伴需求,Haivivi将非常期待。另外,对于有隐私需求的成年人而言,端侧AI玩具如同“树洞”,可以让用户更安心地分享情绪。Haivivi也希望成为全球首个推出端侧AI玩具的团队。