科幻作品中对于“巴别鱼”的描绘,一直寄托着人类对实现无缝跨语言交流的终极向往。在现实世界中,将这一愿景转化为可能的技术征程,早在2017年便由时空壶公司正式启程。当时,整个行业尚未将目光聚焦于此,时空壶却已率先发布了全球首款翻译耳机,向这一看似遥不可及的目标发起了挑战。其核心理念始终明确:要普及机器翻译,关键在于打破传统专业同传的交互壁垒,让技术服务于人类最本能、最无感的交流模式。
这种极具前瞻性的思路,不仅奠定了时空壶多年来的产品发展方向,也让这家公司在全球市场中逐步确立了“隐形冠军”的地位。自2019年首代产品在海外市场问世以来,时空壶已深耕专用翻译耳机赛道逾六年,从最初的拓荒者成长为如今定义产品功能与形态的创新引领者。
在2025年9月德国柏林的IFA展会期间,时空壶携其最新旗舰产品W4 AI同传翻译耳机隆重登场。该产品再次以极致的务实主义,回应了最初的梦想——即“AI翻译,首先要确保对方能清晰听懂你说什么”。它直指行业中最核心也最常被忽视的痛点:如何在真实世界的嘈杂环境中,保障输入信号的纯净无暇,这正是W4创新突破的关键。
硬件创新铸就卓越拾音
时空壶创始人兼CEO田力在介绍W4时,并未过度渲染遥远的AI未来,而是选择直面最基础却也最关键的行业难题:噪音干扰下的语音识别。面对展会现场喧嚣的人声与背景音乐,大部分音频设备都束手无策,而W4却能实现令人惊叹的清晰度。
其背后的秘密武器,并非仅仅依赖复杂的软件算法,而是一项看似“返璞归真”的硬件创新——一套被命名为“骨声纹传感器捕捉技术”的多麦克风融合系统。这套系统的核心是一颗定制的骨传导传感器,它不以空气为介质,而是通过捕捉用户说话时头骨的振动来拾取声音。这意味着,无论周围环境多么嘈杂,如地铁轰鸣、餐厅喧嚣或展会吵嚷,这些通过空气传播的噪声都无法干扰到信号的精确采集。
与此同时,W4的每只耳机还配备了两颗传统的气导麦克风,用于收集声音中的环境信息与细节。最终,通过时空壶自主研发的融合算法,将来自骨骼振动和空气传导的两种信号进行智能整合,从而精准地提取出佩戴者最纯粹的人声,从物理源头保障了一个洁净无扰的音频信号输入。
这种理念与主流的软件降噪技术存在本质区别。传统的降噪技术更像是一种“减法”,它首先录制一个混杂了人声和噪音的音频,再试图通过算法将噪音“去除”,这个过程不可避免地会损伤人声的细节,甚至产生失真。而时空壶的方案则更像是一种“加法”或“保护”,它从一开始就获得了一个几乎不受污染的人声音源,从而保障了后续翻译环节的输入质量。田力对此解释道:“我们的许多创新其实集中在硬件与特定的算法上,它并非大家普遍理解的纯粹基于云端的AI翻译。真正决定用户交互体验的,不只是翻译引擎本身,更是其前端的诸多环节。”
W4耳机在外观设计上也贯彻了这种务实哲学。它看上去与普通的真无线耳机并无显著差异,没有夸张的科技元素。其设计语言低调而优雅,充电盒手感温润,耳机本体则通过人体工学优化,确保了长时间佩戴的舒适性。将所有核心的智能模块和电池都巧妙地收纳于小巧的机身之中,体现了对用户日常使用体验的深刻理解。
专注与沉淀:隐形冠军的成长路径
推出这款产品的时空壶,早已不是一家初出茅庐的创业公司。然而,其成长路径在中国硬件公司中显得颇为“非典型”。早在众多企业将“出海”作为战略口号之前,时空壶就已在海外市场默默耕耘。他们选择先在美国市场发力,初期海外与国内的销量占比一度达到惊人的9:1。这种策略使他们得以在最成熟、竞争最激烈的市场中打磨产品,并直接服务于那些对跨语言沟通有着最迫切需求的用户群体,包括游客、商务人士以及跨国生活的家庭。
时空壶将自己的核心用户定义为“专业型消费者Prosumer”,田力认为这与大疆无人机的早期用户画像颇为相似。这些用户购买产品并非仅仅为了尝鲜,而是为了解决一个专业且刚性的需求。如今,随着全球用户累计突破100万,国内市场的认知度也逐渐提升,时空壶的销售比例也调整至更为均衡的“七三开”。
这种稳健风格的背后,是田力对公司经营原则的坚持。他本人并非典型的硅谷式创业者,公司不依赖一轮又一轮的融资维持生命线,团队规模也保持着克制,从2023年的几十人稳步增长至如今的一百多人。“我们早已实现净利润为正,”田力在专访中坦言,“我们不是那种等着救命钱来干活的公司。”因此,他们更愿意将资源和精力投入到产品本身的迭代与精细打磨中,保持着一种在当前创投环境中略显“缓慢”的节奏。
Babel OS:构筑全栈AI翻译核心
随着用户量突破百万,在真实嘈杂环境中进行清晰、流畅跨语言对话的需求已清晰可见,W4项目应运而生。除了在收音清晰度上的硬件突破,时空壶更是在系统和算法层面构筑了坚实的核心壁垒。这套自主研发的系统被命名为“巴别系统”(Babel OS),它集成了时空壶多年来在翻译领域的经验与技术沉淀。
Babel OS的第一个支柱,是解决同传中“速度”与“准确性”矛盾的关键技术——“AI语义切分”。田力解释道,同传领域有一个经典难题:传统的机器翻译同样需要等待一个完整的句子或语义单元,因此会产生延迟。而时空壶的技术,能通过大模型实时分析语义,判断一个意群是否完整,从而做出预判性的翻译,先把主干意思传递出去,后续再快速修正。这正是用技术去无限逼近一个优秀同传译员的判断力。
田力补充道:“行业标准里,真人同传译员的准确率也并非100%,大约是80%多,因为他们追求的是快和流畅。我们做的,就是用技术实现这种平衡。”
Babel OS的第二个支柱,则是利用大语言模型(LLM)实现“语境感知翻译”。这是解决翻译准确性,尤其是处理多义词和近音词的关键。例如,在英语中,“to, too, two”或“there, their, they're”等词语,如果脱离上下文,机器很难准确判断。时空壶通过其自研的“TurboFast AI翻译引擎”和LLM的强大能力,让系统能够理解对话的整体语境,从而在这些细微之处做出精准的判断,极大地提升了翻译的自然度和准确性。
“我们最开始也用谷歌、微软的引擎,但很快发现,要达到理想的用户体验,必须亲自动手去改造模型,”田力说。如今,无论是谷歌还是三星,都选择将翻译作为其旗舰耳机的一项附加功能。而时空壶的全栈自研模式,则展现了截然不同的决心。田力指出,大厂的翻译引擎在许多小语种上表现不佳,例如阿拉伯语、越南语等,存在大量未被解决的“角落案例”。
对此,时空壶的结论是:只有自研才能实现端云一体的深度优化,例如通过前端对声音进行特殊编解码,再喂给云端专门训练过的模型,从而极大提升速度和鲁棒性。这种覆盖硬件、固件、系统到AI模型的全栈能力,让时空壶更像一家专注的通信设备公司,而非纯粹的AI软件公司。
定义同传翻译新标准:从L1到L5的愿景
在时空壶内部,他们用一个L1到L5的框架来定义“好的跨语言交流”,本次随着W4发布,这一类似自动驾驶行业标准的“同传翻译行业标准”也一并向外界揭晓。
- L1,是电子词典级别的“词对词”翻译,仅限于基础词汇的互换。
- L2,是谷歌翻译App式的“句对句”翻译,交互过程是断续的,需要等待完整语句。田力认为,市面上大部分产品,包括巨头们推出的功能,其交互方式——例如两人轮流对着手机讲话——决定了体验只做到了L2.5,这并非人类自然的交流方式。
而时空壶努力实现的是L3——自由对话。为了达成这一目标,W4提供了多种精心设计的翻译模式。核心的“双语对话”模式,允许两个人各佩戴一只耳机,进行近乎实时的、面对面的自然交流,翻译结果会直接在各自的耳机中播放。此外,还有适用于听讲座的“听译模式”,以及为问路等快速场景设计的“问答模式”。这些模式覆盖了用户在旅途和商务中最常见的使用场景,真正让“边走边聊”的跨语言沟通成为可能。
但L3也并非他们设想中AI同传耳机的终点。“我们的目标是L4,达到高级同传译员的水平,”田力这样介绍时空壶对同传翻译耳机场景的规划。
在采访中,田力还与作者分享了一个现实中土耳其高级译员的故事:在一次同传中,官员即兴讲了个本土笑话,译员知道直译国外听众无法理解,便在电光火石间对着麦克风说:“现在,领导讲了一个笑话,请大家笑一下。”全场爆笑,效果绝佳。“你看,这已经超越了语言本身,是对意图、情绪和氛围的理解。这是AI目前最难做到的,需要多模态的感知,也是我们努力的方向。”这个案例深刻揭示了L4翻译所需的情境洞察力与文化适应性。
AI翻译赛道中的「大疆」之路
正是基于这种对专业体验的极致追求,时空壶选择了耳机这一产品形态,并为其设定了349美元的专业级定价。面对外界关于“凭什么卖这么贵”的质疑,田力显得十分自信,在对话中,他将时空壶的产品逻辑比作大疆的无人机,而非智能音箱。“你购买大疆的无人机,不是因为它也能当风扇,而是因为它在航拍这个专业领域做到了极致。我们的用户选择W4,是因为它在跨语言沟通这个特定场景下,提供了远超通用设备的卓越体验。”
这或许也是时空壶为何并未急于像其他AI硬件一样,采用订阅制收费的原因。田力认为,在行业整体成熟度仅在“及格线”徘徊时,首要任务是把基础体验从70分做到100分,而不是过早推出一个100分产品才需要的高级商业模式。
在谈及与科技巨头的竞争时,田力认为小型公司永远有机会。“谷歌做硬件,恕我直言,一直有种‘玩票性质’,”他回忆,“我2019年在湾区见过他们项目的人,他们觉得这个功能很酷,就做出来了,但用户用得好不好,不是最在意的。所以谷歌硬件总是‘起个大早,赶个晚集’。”对巨头而言,翻译只是其庞大生态中的一项附加功能;而对于时空壶,“这是我们的‘命根子’。小公司与大公司相比,本质上比的还是认真和专注。”
为了更加直观地展示机器翻译的真实水平,时空壶此前曾使用自家产品,参与过一场“人机大战”,让其产品与真人同传译员同台竞技。这不仅是一次营销活动,更是向顶级译员学习的方式。“通过这种极限对比,我们能更清楚地看到自己的差距和努力的方向,”田力说。这种开放态度体现了其产品迭代的严谨性。
关于AI硬件乃至时空壶本身的未来,田力聊到驱动着他和团队前行的朴素愿景。他相信,人类作为社会性动物,天生渴望交流与连接,而语言的壁垒所带来的,是真实存在的不安与孤立。在他看来,时空壶的使命,是要打造一把钥匙,去开启那扇因语言而紧锁的沟通之门,赋予人们跨越鸿沟的勇气——那种可以跟任何人交流、去连接的从容。这才是他们最大的成就感来源。
“人类是社会性动物,天生渴望交流和连接,”在采访的最后,田力回归到了创业的初心,“当你去到一个陌生的国家,语言不通时,那种不安全感是真实存在的。我们希望通过产品,赋予人们勇气,让他们可以很爽地去跟任何人交流,去连接,去成为朋友。”
因此,从某种程度上,W4不仅仅是一款追逐AI浪潮的硬件。它更是时空壶对这种愿景的载体,是这家公司用近十年的专注与积累,为消除人类的隔阂所献上的最新答案。“消除语言障碍,可能不是一百年内能完成的事,”田力坦言,“但我们正走在这条路上,并为此不懈努力。”