AI眼镜:Agent as Hardware的终极形态与未来机遇

0

在人工智能技术飞速发展的今天,我们正站在一个新时代的门槛上。AI不再满足于被困在服务器机箱里,它们渴望获得'身体',渴望拥有感官,渴望获取新的增量数据。在这一背景下,看似沉寂的AR/XR行业因AI的赋能而重新升温,而智能眼镜,特别是35克级别的轻量化AI眼镜,被视为未来十年的主流形态,可能成为AI时代的'下一个iPhone'。

一、无感交互:AI的视觉觉醒

人类获取的90%信息来自视觉。当AI成为人类的随身智能设备时,视觉同样是最关键的部分。AI如何帮助我们从'看到'走向'看清'整个世界?这正是当前科技行业正在探索的核心问题。

随着AI能力的飞速跃升,我们意识到,过去想象中的交互方式——从手机上的'触控屏幕',到XR头显中的手势及多模态操作——其实都算不上最自然的交互。人与人之间的交流才是最自然的。因此,下一代人机交互的终极形态应当是'无感交互',就像人与人之间若能心有灵犀,便能'想我之所想,见我之所见',最终无需多言就能懂得彼此的真正需求。

眼镜,作为距离人眼最近的设备,是天然适合成为下一个终端的载体。我们的目标是希望在未来二十年里,让大家能够从屏幕中抬起头来。回顾科技发展史,我们的注意力始终被禁锢在面前的屏幕上;而眼镜的出现,将改变这一现状。

AI眼镜交互概念

二、Agent的硬件化:超越软件的局限

今天的AI似乎缺乏触觉,也缺乏视觉,仿佛被困在了计算机的服务器里。它就像一位饱读诗书、通晓人类千年文明精华的智者,却始终无法睁开眼睛看世界。眼镜将是AI在下一阶段最好的载体,我们要赋予它全新的视觉能力。

在谷歌的IO大会上,他们提出了未来AI的发展目标:在变得越来越强大的同时,也要越来越个性化、越来越主动化。要实现这两点,前提是AI需要了解用户的历史,拥有生活中的上下文。随着大模型从单纯的语言模型走向多模态模型,我们发现,当你不断赋予AI对3D真实世界的感知能力时,它的能力也会随之显著提升。

手机绝不是AI天然的最佳载体。十年前的电影《Her》中有一个桥段令人印象深刻:AI角色Samantha对男主角说,'我想看看你的世界',于是男主角用别针将手机摄像头固定在衬衫口袋上,让它看见外部世界。今天我们正在做的,就是打造一个'更好的手机'、一枚'更好的别针',让AI能够真正伴随我们,更好地理解我们的生活。

在AI的基础上,我们衍生出了越来越多的Agent。这些Agent能够更好地理解用户的诉求,完成一系列复杂的任务。以前我们提到的Agent大多运行在手机或电脑上,属于软件形态。而今天,我们提出了一个全新的概念:Agent不应仅仅是软件,更应该是一个'硬件化的Agent',这样才能最大范围地释放AI的能力。

三、增量数据:AI通向AGI的必经之路

观察今天的数据现状,我们主要利用存量数据来训练大模型。公域数据构成了大模型的基础语料库,而在不同的大公司内部,还有私域数据,例如谷歌拥有用户的文档、Gmail等信息,能让办公相关的背景信息更加充实;国内像小红书这样的平台,也涵盖了非常有价值的私域数据。

但现有的无论是公域还是私域的存量数据,都已接近枯竭。如果我们想把AI带入下一阶段,让它变得更个性化、更主动、更强大,我们需要的是'增量数据'。未来,我们看到两个巨大的增量数据来源:一个是眼镜,一个是机器人。在具身智能机器人大规模普及之前,我们相信,戴在眼前的眼镜将是为AI提供更多个性化增量数据的最佳入口和途径。

智能眼镜数据采集

眼镜所带来的'增量数据'很可能是AI通向AGI的必经之路。这些数据将帮助AI更好地理解用户的真实世界环境、行为模式和社交互动,从而使AI从单纯的文本处理工具转变为真正理解世界的智能体。

四、不可能三角:智能眼镜的技术挑战

虽然想象很美好,但现实中智能眼镜行业依然面临着重重挑战,尤其是无法突破的一些物理规律。今天的AI眼镜仍然面临着'不可能三角'的挑战:全天候舒适佩戴、极佳的显示效果以及强大的AI智能化。目前没有任何一款设备能同时完美解决这三点,能解决其中两点就已经非常出色了。

回顾这个行业十年的起伏,新一波浪潮因AI的赋能而呈现出产品井喷的状态。我们看到一个明显的变化:早期产品形态以头盔为主,但在2024、2025年之后,轻量化眼镜将逐渐成为主流。这也是整个XR行业从小众市场走向大众普及的必然阶段。

从另一个角度来看时机。在该领域投入最大的巨头Meta,依然在持续加大投入,却尚未迎来明显的拐点。这反映了智能眼镜行业面临的现实困境:前景如此美好,现实却如此艰难。

五、二元化形态:智能眼镜的未来图景

展望十年之后,我们经常会陷入一个误区,试图用一种单一的产品形态去想象未来。就像人们戴眼镜一样,希望未来的智能眼镜能像今天的近视镜一样轻巧。但很可惜,正如我们曾想把手机的功能全部塞进手表里一样,这涉及到无法逾越的物理客观规律。

因此,智能眼镜很可能会存在'二元化'的产品形态:

1. 全天候形态

这种眼镜可能做到35克以下,与现在的近视眼镜无异。它能真正实现全天候佩戴,AI将'住'在你的眼镜里,24小时伴随你,或者至少在你醒着的时候一直陪伴。它需要极强的多模态AI能力。但受限于物理规律,这种轻量化眼镜有一个致命问题:它的显示效果做到极致,可能也只能达到今天汽车HUD的水平,非常透明、无感,但无法用来观看高清电影,注定只能承载一部分功能。

2. 高性能形态

这种形态则以更好的显示效果为基准。它虽然也能全天候携带,但未必是全天候佩戴。它更像是一副'近视眼镜+墨镜'的组合,用户根据不同场景选择不同的设备。它有机会承载更丰富的生态内容。我们相信最终它的重量会比今天轻巧很多,大约做到50到60克。

智能眼镜二元化形态

六、iPhone时刻:智能眼镜的突破之路

既然我们预想了这样的形态,为什么海外巨头在今天明显不如当年iPhone时代那样'给力'了?这些巨头投入了巨额研发资金,拥有全球最优秀的工程师,却依然没有拿出像当年iPhone、特斯拉、大疆那样让人惊艳的产品。

这背后反映了一个趋势:过去二十年,我们见证了美国及西方许多科技公司硬件创新的全面'空心化'。变革正在发生,'定义'往往源于美国,但不仅仅是制造,越来越多的'创造'正在向中国靠拢。

那么,'iPhone时刻'何时到来?今天距离那个时刻还差什么?我认为有四个关键挑战需要解决:

1. 硬件微型化

回顾所有大厂的第一代产品形态,包括苹果2024年推出的Apple Vision Pro,大家都能看到,厂商都希望做一个'大而全'的产品。但他们忽略了一点:只有微型化,才能让产品进一步向大众普及。XREAL在这方面做得最好的一点就是,从第一天起就坚信'只有小型化才有机会'。我们将所有研发力量都投入到如何实现小型化上,包括在芯片、显示和制造工艺上的突破,这让我们在相关领域取得了代际领先。

2. 多模态AI

我们需要真正赋予AI一个3D化的世界模型。在这方面,越来越多的模型从LLM迁移到了LMM,AI能够陪我们打游戏、看视频,并通过上下文快速理解复杂的多模态信息。

3. 生态统一

大家记得iPhone问世后发生了什么吗?它彻底统一了交互方式,随后iOS和安卓两大生态彻底统一了开发者的接口,这直接导致了内容赛道的井喷式增长。智能眼镜也需要类似的生态统一,才能迎来真正的爆发期。

4. AI个性化与长期记忆

在AI基础之上,我们需要让AI拥有'长期记忆'。这是什么概念?比如今天我见到一个人,AI会帮我回忆过去三年我们在哪些场合见过、交流过什么核心信息、他对我有过什么意见、还有什么重要事务需要处理。这与我们大脑的结构是一样的。目前的AI记忆大多是基于长文本输入的短期记忆,我们相信在两到三年内,基于AI大模型的长期记忆会有所突破。

如果攻克了这四点,我们相信一个真正具备'iPhone时刻'意义的产品将会问世。这一突破预计在未来两到三年内发生,届时大家将看到像初代iPhone一样令人惊艳、值得期待的全新全天候AI智能眼镜。我们希望这个时间点是2027年,如果真是2027年,那恰好是20年的轮回:从2007年初代iPhone到2027年。

七、全球联盟:智能眼镜的未来生态

到底谁能引爆这场革命?过去我们希望像苹果、特斯拉这样的公司能帮我们定义好产品,其他人直接'效仿'。但在今天的时代,基于我们观察到的趋势,很可能没有一家公司能包揽一切,我们更有可能看到的是一个'全球联盟'。

在今年的谷歌I/O大会上,XREAL与谷歌联合发布了关于Project Astra的轻量化眼镜探索。这让我们第一次有了当年iPhone问世时的感觉。我们发现所有的要素都开始成熟了:硬件形态足够轻巧,体验足够好,拥有足够开放的第三方内容生态,让开发者能快速移植或开发全新内容。

最重要的是用户交互。苹果在iPhone上引入了多点触控,统一了智能手机最重要的交互点;今天,我们认为AI将是XR最好的交互方式。就像电影《Her》里那样,我们通过让AI住进眼镜里,以无感的方式结合AI实现全新的交互。

AI眼镜生态合作

大家可以设想一下,拥有了海量现有的安卓生态内容,结合焕然一新的AI交互,再加上轻量化的产品体验,我们可以期待安卓XR在未来几年给大家带来的变革。同时,这也是第一个原生的AI操作系统。我们相信,在巨头的争夺下,中国公司也有机会通过联盟的方式,参与到全球产品的定义和竞争中去。

虽然今天AI的'大脑'是在大洋彼岸被创造和定义的,但我们相信,承载它的'眼镜'将越来越多地在中国诞生,中国今天是全球硬件制造业创新的核心基地。

八、最后一块屏幕:中国企业的机遇

同样,我们也相信眼镜可能是我们在座各位有生之年遇到的'最后一块屏'的机会。我们希望这块人类所需的'最后之屏',能由我们这一代人亲眼见证,甚至有机会去参与、引领和定义。

虽然目前的成果还没有达到初代iPhone那般惊艳的程度,但这可能是我们和谷歌一起,在过去两年联合打造的、现阶段最好的'版本答案'。我们希望能给大家带来惊喜,让大家看到未来几年这个行业将会涌现出怎样不同的产品形态和体验。

如果AI终端的竞争是一场万米长跑,那么向下深耕、打好基础,跑对方向比今天的抢跑更重要。中国企业在智能眼镜硬件领域的创新,正在为全球AI生态的发展提供重要支撑。从硬件微型化到多模态AI,从生态统一到长期记忆,每一步突破都将是AI眼镜走向成熟的关键。

在AI与硬件深度融合的时代,智能眼镜不仅是AI获得视觉感官的载体,更是连接数字世界与真实世界的桥梁。通过这扇窗,AI将不再被困在服务器机箱里,而是真正走进我们的生活,理解我们的世界,成为我们身边不可或缺的智能伙伴。