在生成式AI技术蓬勃发展的今天,我们几乎无法回避其影响。即使你没有主动寻找AI助手,这项技术也正在被整合到几乎每个产品和服务中。Google推出的Gemini Home服务正是这一趋势的最新体现,它将Gemini AI与用户已有的智能家居设备相结合,试图让AI技术真正为日常生活服务。对于已购买Google Home扩展视频历史记录的用户来说,他们将获得一大堆AI功能,包括日常摘要、AI标记的通知等。
考虑到像Gemini这样的AI模型的强大能力,识别几个视频片段中的事件并回答相关问题似乎并非难事。然而,Gemini Home却表现出对事实的脆弱理解,导致一些令人不安的互动,如周期性的人或动物入侵警报。
AI智能家居:是革命还是噱头?
简单使用Google Home应用控制设备并不会将你的智能家居交给Gemini。这是Google更高级的付费服务的一部分,每月20美元的订阅费提供扩展摄像头历史记录和Gemini功能。更便宜的10美元计划提供较少的视频历史记录,没有AI辅助的摘要或通知。两种计划都支持智能音箱上的Gemini Live。
根据Google的说法,它不会将你的所有视频发送给Gemini。那将是对计算资源的巨大浪费,因此Gemini只查看(并总结)事件片段。这些摘要在一天结束时被提炼成"每日简报",通常会产生相当乏味的列表,记录人们进出房间、包裹投递等事件。
重要的是,支持此体验的Gemini模型不是多模态的——它只处理视频的视觉元素,不整合录音中的音频。因此,摄像头捕捉到的异常噪音或对话不会被搜索或反映在AI摘要中。这可能是为了确保你的对话不会被AI重复使用。

购买Google的AI增强订阅还添加了"Ask Home"功能,这是一个对话式聊天机器人,可以根据智能家居设备的状态和你的视频回答有关家中发生事件的问题。你可以询问事件、检索视频片段并创建自动化。
Ask Home在创建自动化方面确实存在一些问题,但Gemini对此的理解相当不错。在旧的Home应用中设置自动化是可能的,但更新的AI能够根据你的自然语言请求组合自动化。可能由于可能的自动化元素有限,AI在大多数时候都能正确处理。Ask Home通常也能够挖掘过去的事件片段,只要你对想要的内容具体说明。
Gemini Home的高级计划将你的视频保存60天,因此你只能查询该时间段内的片段。Google表示它不会保留任何这些视频用于训练。Google使用安全摄像头镜头进行训练的唯一情况是,如果你通过Home应用中的一个模糊选项选择"借出"它给Google。Google表示它将保留这些视频长达18个月,直到你撤销访问权限。然而,你与Gemini的互动(如你的提示输出和评分)用于改进模型。
"意外,一只鹿短暂进入了客厅"
每个生成式AI机器人都会偶尔犯错,但你可能不会注意到每一个。然而,当AI对你日常生活的描述产生幻觉时,就更显眼了。没有理由Google会对我的智能家居设置感到困惑,它有几个户外摄像头和一个室内摄像头——都是Nest品牌,启用了所有默认AI功能——用来监控我的狗。因此,AI看到了很多狗在周围闲逛和凝视窗户。人们希望它能可靠地总结如此直接的事情。
然而,人们可能会失望。
在我的第一个每日简报中,我惊讶地看到Google发现了一些室内野生动物。"意外,一只鹿短暂进入了客厅,"Gemini说。

狗和鹿基本上是一回事,对吧?
Gemini确实应该获得一些认可,因为它认识到鹿出现在客厅将是意外的。但"鹿"自然是一只狗。这也不是一次性事件。Gemini有时会正确识别我的狗,但许多事件片段和摘要仍然告诉我,鹿和院子里有野生动物显著但短暂地出现。
这种情况敏锐地提醒我们,这种新型AI不会"思考",尽管行业使用这个词来描述模拟推理可能会让你相信其他情况。一个人在看到视频后,甚至不会考虑他们看到鹿的可能性,特别是当他们已经在其他视频中看到狗在奔跑时。然而,Gemini没有这种常识基础。如果标记说的是鹿,那就是鹿。不过,我得说,Gemini在识别汽车型号和品牌标志方面很出色。你可以自己判断这意味着什么。
动物混淆并不理想,但它不是可用性的主要障碍。我没有认真考虑过鹿闯入房子的可能性,而且每日报告继续对野生动物入侵表示惊讶的方式有点好笑。这是一个相当无害的错误。
"整体识别准确性取决于几个因素,包括Gemini处理的摄像头片段中的视觉细节细节,"Google发言人解释道。"作为大型语言模型,Gemini有时会做出推断错误,导致这些误识别,例如将你的狗与猫或鹿混淆。"
Google还说,当AI出错时,你可以通过纠正它来调整AI。这有时有效,但该系统仍然没有真正理解任何东西——这超出了生成式AI模型的能力。在告诉Gemini它看到的是狗而不是鹿之后,它看到野生动物的次数减少了。然而,它似乎并不总是信任我,导致它报告出现"可能"只是一只狗的鹿。
适合恐怖季节的完美搭配
Gemini的智能家居幻觉也有不那么喜剧的一面。当Gemini错误标记事件片段时,你可能会收到相当令人不安的警报。想象一下,当你外出时,你的Gemini助手向你发送通知:"有人在客厅被看到。"
有人在你认为空荡荡的房子里闲逛?这很令人警觉。是入侵者、幻觉,还是_幽灵_?所以自然地,你会查看摄像头画面,结果...什么都没有。《Ars Technica》调查确认AI无法检测到幽灵。那么是机器中的幽灵吗?

Oops,我们让你以为有人闯入了你的房子。
几次,我看到Gemini将狗和完全空的房间(或可能是阴影?)误认为一个人。起初这可能令人不安,但经过几次误报后,你会开始不信任这个机器人。现在,即使Gemini正确识别了房子里的随机人,我可能也会忽略它。这是Gemini Home高级版的默认通知体验。如果你想关闭这些通知并返回经典版本,你必须为每个受影响的摄像头禁用Gemini for Home。Google指出你还可以在应用中禁用人脸检测警报。当你开启Google的熟悉面孔检测时,这些警报会被启用。
Gemini通常只是稍微扭曲现实,而不是凭空创造。在后院拿着任何东西的人都在做院子工作。任何地方的一个人,做任何事,都变成了几个人。一个狗玩具变成了在阳光下晒太阳的猫。几只鸟变成了浣熊。Gemini也喜欢忽略事情,比如即使有标记为"人投递包裹"的视频,也拒绝承认有包裹投递。

Gemini仍然拒绝承认它错了。
归根结底,Gemini正确标记了大多数片段,因此产生的大部分通知是准确的,尽管有时没有帮助。问题是"大多数"的另一面仍然是很多错误。其中一些错误促使你检查摄像头——至少,在你对Gemini的幻想感到厌倦之前。它没有节省时间并让你了解家中发生的事情,而是浪费了你的时间。为了使这个东西有用,推断错误不能每天发生。
边学习边前进
Google表示其目标是让Gemini Home对每个人变得更好。团队正在"大力投资提高准确识别能力",以减少错误通知。公司还认为,让人们添加自定义说明是解决这个难题的关键部分。也许未来,Gemini Home会更加诚实,但目前需要大量指导才能将其推向正确的方向。
通过仔细调整,你确实可以解决Gemini Home的一些幻想。在调整后,我看到鹿的识别减少了,几个自定义说明使得家庭简报浪费更少的空间告诉我人们进出不存在的房间。但我仍然不知道如何提示Gemini让它在空房间里看不到人。
尽管Google有改进Gemini Home的意图,但它发布的产品在开箱即用时效果不佳,其行为方式确实令人反感。安全摄像头不应该谎称看到入侵者,也不应该在无法识别事件时说我_在_撒谎。Ask Home机器人有标准免责声明,建议你验证AI所说的话。你必须认真对待对Gemini Home的警告。
在发布时,很难证明每月20美元的高级Gemini订阅是合理的。如果你已经付费是因为你想要60天的事件历史记录,那么你就必须接受AI通知。不过,你可以忽略每日简报的存在。降至每月10美元的订阅计划可让你获得30天的事件历史记录,使用旧的非生成式通知和事件标记。也许这是目前更智能的智能家居选择。
Gemini Home对于那些在Home应用中选择早期访问的用户广泛可用。因此,你可以暂时避免使用Gemini,但Google为每个人切换这只是时间问题。
希望到那时它能更好地工作。
AI智能家居的现在与未来
Gemini Home的案例揭示了当前AI技术在家庭监控应用中的几个关键挑战。首先,尽管大型语言模型在处理文本方面表现出色,但它们在视觉识别任务中仍然容易出错,特别是在复杂或模糊的环境中。将狗识别为鹿、将空房间误判为有人进入,这些错误不仅影响用户体验,还可能引发不必要的焦虑。
其次,AI系统的透明度和可解释性仍然是一个问题。当Gemini做出错误判断时,用户很难理解其推理过程,也难以确定何时应该信任AI的建议。这种不确定性使得AI辅助的家庭安全系统在某些关键应用中难以完全依赖。
然而,Gemini Home也展示了AI技术的潜力。通过自然语言创建自动化、检索特定事件视频等功能,确实为用户提供了便利。随着Google和其他公司继续投资改进这些系统,我们可以期待更准确、更可靠的AI智能家居解决方案。
对于消费者而言,关键是要了解当前AI技术的优势和局限,并根据自身需求做出明智的选择。如果你只是需要一个基本的家庭监控系统,传统的非AI解决方案可能仍然是最可靠的选择。但如果你愿意接受一些不准确性并享受AI带来的便利,那么像Gemini Home这样的服务可能值得考虑——特别是当其价格变得更加合理时。
随着AI技术不断融入我们的日常生活,理解它的工作原理、优势以及局限性将变得愈发重要。Gemini Home的早期版本可能不完美,但它代表了智能家居技术发展的一个重要方向,值得我们关注和参与讨论。










