智能眼镜：Agent as Hardware时代的视觉革命

在AI技术飞速发展的今天，我们正见证着一个全新的时代——「Agent as Hardware」的崛起。当AI不再满足于被困在服务器的机箱里，它渴望「身体」，渴望感官，渴望与真实世界建立更紧密的联系。在这场变革中，智能眼镜正逐渐成为AI获取视觉信息的关键载体，有望成为继智能手机之后的下一代计算平台。

AI的「身体」渴望

人类获取的90%信息来自视觉，这决定了视觉在AI发展中的核心地位。当我们谈论AI如何帮助我们从「看到」走向「看清」整个世界时，实际上是在探讨AI如何获得感知真实世界的能力。

XREAL创始人兼CEO徐驰在极客公园创新大会2026上提出了一个引人深思的问题：如果AI需要一个实体，下一代的它应该长什么样？这个问题不仅关乎技术发展，更关乎人机交互的未来形态。

"今天的AI似乎缺乏触觉，也缺乏视觉，仿佛被困在了计算机的服务器里。"徐驰形象地比喻道，"它就像一位饱读诗书、通晓人类千年文明精华的智者，却始终无法睁开眼睛看世界。"

这种「被困」状态正在被打破。随着大模型从单纯的语言模型走向多模态模型，AI对3D真实世界的感知能力正在显著提升。而眼镜，作为距离人眼最近的设备，成为了AI在下一阶段最理想的载体。

无感交互：下一代人机交互的终极形态

回顾人机交互的发展历程，从键盘到鼠标，从触控屏幕到手势操作，每一次革新都让人类与数字世界的连接更加紧密。然而，这些交互方式与人与人之间的自然交流相比，仍显得不够直观。

"下一代人机交互的终极形态，应当是'无感交互'。"徐驰表示，"就像人与人之间若能心有灵犀，你便能'想我之所想，见我之所见'，最终无需多言，就能懂得我真正想要什么。"

无感交互示意图

这种无感交互的实现，需要AI具备对人类意图的理解能力，而这又依赖于AI对真实世界的感知。眼镜作为AI的「眼睛」，能够持续不断地收集环境数据，为AI提供理解世界的窗口。

在电影《Her》中，男主角用别针将手机摄像头固定在衬衫口袋上，让AI角色能够看见外部世界。今天我们所做的，就是打造一个「更好的手机」、一枚「更好的别针」，让AI能够真正伴随我们，更好地理解我们的生活。

增量数据：AI通向AGI的必经之路

当前AI的发展主要依赖于存量数据——无论是公域数据还是私域数据，都已接近枯竭。如果我们想把AI带入下一阶段，让它变得更个性化、更主动、更强大，我们需要的是「增量数据」。

"眼镜所带来的'增量数据'，很可能是AI通向AGI的必经之路。"徐驰强调道。这些增量数据包括用户在日常生活中持续产生的视觉、听觉等多模态信息，能够为AI提供前所未有的个性化上下文。

增量数据概念图

未来，我们看到两个巨大的增量数据来源：一个是眼镜，一个是机器人。在具身智能机器人大规模普及之前，戴在眼前的眼镜将是AI获取更多个性化增量数据的最佳入口和途径。

然而，理想与现实的差距依然存在。今天的AI眼镜仍然面临着「不可能三角」的挑战：全天候舒适佩戴、极佳的显示效果以及强大的AI智能化。目前没有任何一款设备能同时完美解决这三点，能解决其中两点就已经非常出色了。

智能眼镜的二元化未来

回顾XR行业的发展历程，我们看到了明显的阶段性特征。早期产品形态以头盔为主，但在2024、2025年之后，轻量化眼镜逐渐成为主流。这也是整个XR行业从小众市场走向大众普及的必然阶段。

"现在的眼镜行业特别像2005、2006年智能手机的前夜。"徐驰指出，"在苹果iPhone出现之前，手机生态呈现出全面的碎片化。虽然当时很多设备销量很高，不乏百万级爆款，但对开发者而言，为这些不同形态的设备做适配简直是噩梦。"

智能眼镜发展历程

展望十年之后，智能眼镜很可能会存在「二元化」的产品形态：

第一种形态，主打「全天候」。十年后，这种眼镜可能做到35克以下，与现在的近视眼镜无异。它能真正实现全天候佩戴，AI将「住」在你的眼镜里，24小时伴随你。但受限于物理规律，这种轻量化眼镜的显示效果可能只能达到今天汽车HUD的水平，非常透明、无感，但无法用来观看高清电影，注定只能承载一部分功能。

第二种形态，则以更好的显示效果为基准。它虽然也能全天候携带，但未必是全天候佩戴。它更像是一副「近视眼镜+墨镜」的组合，用户根据不同场景选择不同的设备。它有机会承载更丰富的生态内容。我们相信最终它的重量会比今天轻巧很多，大约做到50到60克。

「iPhone时刻」的四大挑战

既然我们预想了这样的形态，为什么海外巨头在今天明显不如当年iPhone时代那样「给力」了？徐驰认为，这背后反映了一个趋势：过去二十年，美国及西方许多科技公司硬件创新出现了全面的「空心化」。

"变革正在发生，'定义'往往源于美国，但不仅仅是制造，越来越多的'创造'正在向中国靠拢。"徐驰表示。

那么，「iPhone时刻」何时到来？徐驰认为有四个关键挑战需要解决：

第一是硬件微型化。回顾所有大厂的第一代产品形态，包括苹果2024年推出的Apple Vision Pro，大家都能看到，厂商都希望做一个「大而全」的产品。但他们忽略了一点：只有微型化，才能让产品进一步向大众普及。XREAL在这方面做得最好的一点，就是从第一天起就坚信「只有小型化才有机会」。

第二是多模态AI。我们需要真正赋予AI一个3D化的世界模型。在这方面，越来越多的模型从LLM迁移到了LMM，AI能够陪我们打游戏、看视频，并通过上下文快速理解复杂的多模态信息。

第三是生态统一。大家记得iPhone问世后发生了什么吗？它彻底统一了交互方式，随后iOS和安卓两大生态彻底统一了开发者的接口，这直接导致了内容赛道的井喷式增长。

第四，也是更重要的一点，是如何让AI真正实现个性化。在AI基础上，我们需要让AI拥有「长期记忆」。比如今天我见到一个人，AI会帮我回忆过去三年我们在哪些场合见过、交流过什么核心信息、他对我有过什么意见、还有什么重要事务需要处理。这与我们大脑的结构是一样的。目前的AI记忆大多是基于长文本输入的短期记忆，我们相信在两到三年内，基于AI大模型的长期记忆会有所突破。

中国企业的创新机遇

如果攻克了这四点，我们相信一个真正具备「iPhone时刻」意义的产品将会问世。这一突破预计在未来两到三年内发生，届时大家将看到像初代iPhone一样令人惊艳、值得期待的全新全天候AI智能眼镜。

"我们希望这个时间点是2027年，如果真是2027年，那恰好是20年的轮回：从2007年初代iPhone到2027年。"徐驰预测道。

到底谁能引爆这场革命？徐驰认为，很可能没有一家公司能包揽一切，我们更有可能看到的是一个「全球联盟」。

"在今年的谷歌I/O大会上，我们与谷歌联合发布了关于Project Astra的轻量化眼镜探索。这让我们第一次有了当年iPhone问世时的感觉。"徐驰分享道，"我们发现所有的要素都开始成熟了：硬件形态足够轻巧，体验足够好，拥有足够开放的第三方内容生态，让开发者能快速移植或开发全新内容。"

AI眼镜生态联盟

虽然今天AI的「大脑」是在大洋彼岸被创造和定义的，但我们相信，承载它的「眼镜」将越来越多地在中国诞生，中国今天是全球硬件制造业创新的核心基地。

"同样，我们也相信眼镜可能是我们在座各位有生之年遇到的'最后一块屏'的机会。"徐驰总结道，"我们希望这块人类所需的'最后之屏'，能由我们这一代人亲眼见证，甚至有机会去参与、引领和定义。"

结语

智能眼镜作为AI的「视觉身体」，正在开启一个全新的时代。从「看到」到「看清」，从被动接收信息到主动理解世界，AI通过智能眼镜获得了前所未有的感知能力。虽然前路依然充满挑战，但正如智能手机的发展历程所示，突破往往来自于对基础问题的深入思考和持续创新。

在AI与硬件融合的道路上，中国企业有机会发挥自身优势，在全球智能眼镜生态中扮演重要角色。随着技术的不断进步和生态的逐渐完善，我们正一步步接近那个令人期待的「iPhone时刻」，届时智能眼镜将真正成为连接数字世界与真实世界的桥梁，重塑我们与AI的交互方式。

正如徐驰所言：「如果AI终端的竞争是一场万米长跑，那么向下深耕、打好基础，跑对方向比今天的抢跑更重要。」在这场关乎未来的竞赛中，耐心和远见比短期的速度更为关键。