智能眼镜:Agent as Hardware时代的视觉革命

0

在AI技术飞速发展的今天,我们正见证着一个全新的时代——「Agent as Hardware」的崛起。当AI不再满足于被困在服务器的机箱里,它渴望「身体」,渴望感官,渴望与真实世界建立更紧密的联系。在这场变革中,智能眼镜正逐渐成为AI获取视觉信息的关键载体,有望成为继智能手机之后的下一代计算平台。

AI的「身体」渴望

人类获取的90%信息来自视觉,这决定了视觉在AI发展中的核心地位。当我们谈论AI如何帮助我们从「看到」走向「看清」整个世界时,实际上是在探讨AI如何获得感知真实世界的能力。

XREAL创始人兼CEO徐驰在极客公园创新大会2026上提出了一个引人深思的问题:如果AI需要一个实体,下一代的它应该长什么样?这个问题不仅关乎技术发展,更关乎人机交互的未来形态。

"今天的AI似乎缺乏触觉,也缺乏视觉,仿佛被困在了计算机的服务器里。"徐驰形象地比喻道,"它就像一位饱读诗书、通晓人类千年文明精华的智者,却始终无法睁开眼睛看世界。"

这种「被困」状态正在被打破。随着大模型从单纯的语言模型走向多模态模型,AI对3D真实世界的感知能力正在显著提升。而眼镜,作为距离人眼最近的设备,成为了AI在下一阶段最理想的载体。

无感交互:下一代人机交互的终极形态

回顾人机交互的发展历程,从键盘到鼠标,从触控屏幕到手势操作,每一次革新都让人类与数字世界的连接更加紧密。然而,这些交互方式与人与人之间的自然交流相比,仍显得不够直观。

"下一代人机交互的终极形态,应当是'无感交互'。"徐驰表示,"就像人与人之间若能心有灵犀,你便能'想我之所想,见我之所见',最终无需多言,就能懂得我真正想要什么。"

无感交互示意图

这种无感交互的实现,需要AI具备对人类意图的理解能力,而这又依赖于AI对真实世界的感知。眼镜作为AI的「眼睛」,能够持续不断地收集环境数据,为AI提供理解世界的窗口。

在电影《Her》中,男主角用别针将手机摄像头固定在衬衫口袋上,让AI角色能够看见外部世界。今天我们所做的,就是打造一个「更好的手机」、一枚「更好的别针」,让AI能够真正伴随我们,更好地理解我们的生活。

增量数据:AI通向AGI的必经之路

当前AI的发展主要依赖于存量数据——无论是公域数据还是私域数据,都已接近枯竭。如果我们想把AI带入下一阶段,让它变得更个性化、更主动、更强大,我们需要的是「增量数据」。

"眼镜所带来的'增量数据',很可能是AI通向AGI的必经之路。"徐驰强调道。这些增量数据包括用户在日常生活中持续产生的视觉、听觉等多模态信息,能够为AI提供前所未有的个性化上下文。

增量数据概念图

未来,我们看到两个巨大的增量数据来源:一个是眼镜,一个是机器人。在具身智能机器人大规模普及之前,戴在眼前的眼镜将是AI获取更多个性化增量数据的最佳入口和途径。

然而,理想与现实的差距依然存在。今天的AI眼镜仍然面临着「不可能三角」的挑战:全天候舒适佩戴、极佳的显示效果以及强大的AI智能化。目前没有任何一款设备能同时完美解决这三点,能解决其中两点就已经非常出色了。

智能眼镜的二元化未来

回顾XR行业的发展历程,我们看到了明显的阶段性特征。早期产品形态以头盔为主,但在2024、2025年之后,轻量化眼镜逐渐成为主流。这也是整个XR行业从小众市场走向大众普及的必然阶段。

"现在的眼镜行业特别像2005、2006年智能手机的前夜。"徐驰指出,"在苹果iPhone出现之前,手机生态呈现出全面的碎片化。虽然当时很多设备销量很高,不乏百万级爆款,但对开发者而言,为这些不同形态的设备做适配简直是噩梦。"

智能眼镜发展历程

展望十年之后,智能眼镜很可能会存在「二元化」的产品形态:

第一种形态,主打「全天候」。十年后,这种眼镜可能做到35克以下,与现在的近视眼镜无异。它能真正实现全天候佩戴,AI将「住」在你的眼镜里,24小时伴随你。但受限于物理规律,这种轻量化眼镜的显示效果可能只能达到今天汽车HUD的水平,非常透明、无感,但无法用来观看高清电影,注定只能承载一部分功能。

第二种形态,则以更好的显示效果为基准。它虽然也能全天候携带,但未必是全天候佩戴。它更像是一副「近视眼镜+墨镜」的组合,用户根据不同场景选择不同的设备。它有机会承载更丰富的生态内容。我们相信最终它的重量会比今天轻巧很多,大约做到50到60克。

「iPhone时刻」的四大挑战

既然我们预想了这样的形态,为什么海外巨头在今天明显不如当年iPhone时代那样「给力」了?徐驰认为,这背后反映了一个趋势:过去二十年,美国及西方许多科技公司硬件创新出现了全面的「空心化」。

"变革正在发生,'定义'往往源于美国,但不仅仅是制造,越来越多的'创造'正在向中国靠拢。"徐驰表示。

那么,「iPhone时刻」何时到来?徐驰认为有四个关键挑战需要解决:

第一是硬件微型化。回顾所有大厂的第一代产品形态,包括苹果2024年推出的Apple Vision Pro,大家都能看到,厂商都希望做一个「大而全」的产品。但他们忽略了一点:只有微型化,才能让产品进一步向大众普及。XREAL在这方面做得最好的一点,就是从第一天起就坚信「只有小型化才有机会」。

第二是多模态AI。我们需要真正赋予AI一个3D化的世界模型。在这方面,越来越多的模型从LLM迁移到了LMM,AI能够陪我们打游戏、看视频,并通过上下文快速理解复杂的多模态信息。

第三是生态统一。大家记得iPhone问世后发生了什么吗?它彻底统一了交互方式,随后iOS和安卓两大生态彻底统一了开发者的接口,这直接导致了内容赛道的井喷式增长。

第四,也是更重要的一点,是如何让AI真正实现个性化。在AI基础上,我们需要让AI拥有「长期记忆」。比如今天我见到一个人,AI会帮我回忆过去三年我们在哪些场合见过、交流过什么核心信息、他对我有过什么意见、还有什么重要事务需要处理。这与我们大脑的结构是一样的。目前的AI记忆大多是基于长文本输入的短期记忆,我们相信在两到三年内,基于AI大模型的长期记忆会有所突破。

中国企业的创新机遇

如果攻克了这四点,我们相信一个真正具备「iPhone时刻」意义的产品将会问世。这一突破预计在未来两到三年内发生,届时大家将看到像初代iPhone一样令人惊艳、值得期待的全新全天候AI智能眼镜。

"我们希望这个时间点是2027年,如果真是2027年,那恰好是20年的轮回:从2007年初代iPhone到2027年。"徐驰预测道。

到底谁能引爆这场革命?徐驰认为,很可能没有一家公司能包揽一切,我们更有可能看到的是一个「全球联盟」。

"在今年的谷歌I/O大会上,我们与谷歌联合发布了关于Project Astra的轻量化眼镜探索。这让我们第一次有了当年iPhone问世时的感觉。"徐驰分享道,"我们发现所有的要素都开始成熟了:硬件形态足够轻巧,体验足够好,拥有足够开放的第三方内容生态,让开发者能快速移植或开发全新内容。"

AI眼镜生态联盟

虽然今天AI的「大脑」是在大洋彼岸被创造和定义的,但我们相信,承载它的「眼镜」将越来越多地在中国诞生,中国今天是全球硬件制造业创新的核心基地。

"同样,我们也相信眼镜可能是我们在座各位有生之年遇到的'最后一块屏'的机会。"徐驰总结道,"我们希望这块人类所需的'最后之屏',能由我们这一代人亲眼见证,甚至有机会去参与、引领和定义。"

结语

智能眼镜作为AI的「视觉身体」,正在开启一个全新的时代。从「看到」到「看清」,从被动接收信息到主动理解世界,AI通过智能眼镜获得了前所未有的感知能力。虽然前路依然充满挑战,但正如智能手机的发展历程所示,突破往往来自于对基础问题的深入思考和持续创新。

在AI与硬件融合的道路上,中国企业有机会发挥自身优势,在全球智能眼镜生态中扮演重要角色。随着技术的不断进步和生态的逐渐完善,我们正一步步接近那个令人期待的「iPhone时刻」,届时智能眼镜将真正成为连接数字世界与真实世界的桥梁,重塑我们与AI的交互方式。

正如徐驰所言:「如果AI终端的竞争是一场万米长跑,那么向下深耕、打好基础,跑对方向比今天的抢跑更重要。」在这场关乎未来的竞赛中,耐心和远见比短期的速度更为关键。