在生成式AI浪潮席卷全球的今天,我们似乎无法逃避这项技术对日常生活的渗透。即使你没有主动寻找AI助手,它们也已经悄然融入了几乎所有的产品和服务中。但这一切究竟为了什么?尽管市场上充斥着关于"智能代理"和"通用人工智能"的模糊宣传,但生成式AI究竟能为普通用户带来什么实际价值?Google的Gemini Home服务正是该公司最新尝试,旨在将这项技术与人们已有的智能家居设备整合。任何为Google Home应用支付扩展视频历史记录费用的用户,都将获得一大堆AI功能,包括每日摘要、AI标记的通知等。
鉴于像Gemini这样的AI模型据称拥有强大的能力,识别几个视频片段并回答相关问题似乎并非难事。然而,Gemini Home却展现了对事实的脆弱理解,导致了一些令人不安的互动体验,比如周期性地发出人类或动物入侵家庭的警告。
智能家居真的需要高级AI订阅吗?
仅仅使用Google Home应用控制设备并不会让您的智能家居完全交由Gemini处理。这是Google更高级别付费服务的一部分,该服务每月收费20美元,提供扩展的摄像头历史记录和Gemini功能。更便宜的10美元计划则提供较少的视频历史记录,没有AI辅助的摘要或通知。两种计划都支持智能扬声器上的Gemini Live。
根据Google的说法,它不会将您的所有视频发送给Gemini。这将浪费大量的计算资源,因此Gemini只查看(并总结)事件片段。这些摘要然后在一天结束时被提炼,生成"每日简报",通常结果是一个相当乏味的列表,记录人们进出房间、包裹送达等内容。
重要的是,支持此体验的Gemini模型不是多模态的——它只处理视频的视觉元素,不整合录音中的音频。因此,摄像头捕捉到的异常噪音或对话不会被搜索或反映在AI摘要中。这可能是为了确保您的对话不会被AI重复使用。

支付Google的AI订阅费用还会添加"Ask Home"功能,这是一个对话式聊天机器人,可以根据智能家居设备的状态和您的视频片段回答关于家中发生的问题。您可以询问事件、检索视频片段并创建自动化流程。
尽管Gemini对视频的理解存在一些问题,但Ask Home在创建自动化流程方面相当出色。在旧的Home应用中也可以设置自动化,但更新的AI能够根据您的自然语言请求组合自动化流程。或许由于可能的自动化元素数量有限,AI在这方面大多数时候都能做对。只要您对所需内容具体明确,Ask Home通常也能挖掘出过去的事件片段。
Gemini Home的高级计划会将您的视频保存60天,因此您只能查询该时间段内的片段。Google还表示,它不会保留任何这些视频用于训练。Google使用安全摄像头录像进行训练的唯一情况是,您通过Home应用中一个不太明显的选项选择"借出"视频。Google表示,它将保留这些视频长达18个月,直到您撤销访问权限。但是,您与Gemini的交互(如您的提示和输出评分)用于改进模型。
意外闯入的鹿
每个生成式AI机器人都会偶尔犯错,但您可能不会注意到每一个错误。然而,当AI对您的日常生活产生幻觉时,这会更加明显。Google不应该对我的智能家居设置感到困惑——它配备了几个户外摄像头和一个室内摄像头,都是Nest品牌,默认启用了所有AI功能——主要是为了监控我的狗。因此,AI看到了很多狗在懒散地闲逛和凝视窗外。人们希望它能够可靠地总结如此简单的事情。
然而,您可能会感到失望。
在我的第一个每日简报中,我惊讶地看到Google发现了一些室内野生动物。"意外地,一只鹿短暂地进入了家庭房间,"Gemini说道。

狗和鹿基本上是一回事,对吧?
Gemini确实值得称赞,因为它认识到鹿出现在家庭房间中是出乎意料的。但"鹿"自然是一只狗。这并非一次性事件。Gemini有时会正确地识别我的狗,但许多事件片段和摘要仍然告诉我,鹿在房屋周围和院子里出现了 notable 但短暂的时间。
这种情况敏锐地提醒我们,这种新型AI不会"思考",尽管行业使用这个词来描述模拟推理可能会让您产生相反的想法。一个人在看到视频中狗在其他视频中奔跑后,甚至不会考虑他们可能看到鹿的可能性。然而,Gemini却没有这种常识基础。如果标记说的是鹿,那就是鹿。不过,我得说,Gemini在识别汽车型号和品牌标志方面非常出色。您可以自行判断这意味着什么。
动物混淆并不理想,但这不是可用性的主要障碍。我没有认真考虑过鹿可能闯入房子的可能性,而且日常报告继续对野生动物入侵表示惊讶,这有点好笑。这是一个相当无害的错误。
"整体识别准确性取决于几个因素,包括Gemini处理的摄像头片段中的视觉细节细节,"Google发言人解释道。"作为大型语言模型,Gemini有时会做出推断性错误,导致这些误识别,例如将您的狗误认为是猫或鹿。"
Google还表示,当AI出错时,您可以通过纠正它来调整AI。这有时有效,但该系统仍然没有真正理解任何东西——这超出了生成式AI模型的能力范围。在告诉Gemini它看到的是狗而不是鹿之后,它看到野生动物的频率降低了。然而,它似乎并不总是信任我,导致它报告出现"可能"只是狗的鹿。
完美契合恐怖季节
Gemini的智能家居幻觉也有不太喜剧的一面。当Gemini错误标记事件片段时,您可能会收到相当令人不安的警报。想象一下,当您外出时,您的Gemini助手向您发送通知:"有人在家庭房间被看到。"
有人在您认为空无一人的房子里闲逛?这很令人警觉。是入侵者、幻觉,还是_鬼魂_?所以,您自然会查看摄像头画面以发现……什么都没有。Ars Technica的调查确认AI无法检测鬼魂。那么是机器中的鬼魂?

糟糕,我们让您以为有人闯入了您的房子。
在几次情况下,我看到Gemini将狗和完全空的房间(或者可能是阴影?)误认为一个人。起初这可能令人不安,但在几次误报之后,您开始不再信任这个机器人。现在,即使Gemini正确识别了房子里的随机人,我可能也会忽略它。不幸的是,这是Gemini Home高级版唯一的通知体验。
"您无法在保留基本通知的同时关闭AI描述,"Google发言人告诉我。然而,他们指出,您可以在应用中禁用人脸检测时启用的人员警报。
Gemini经常稍微扭曲现实而不是凭空创造。后院里拿着任何东西的人都在做园艺。任何地方的一个人,做任何事,都变成了几个人。一个狗玩具变成了在阳光下躺着的猫。几只鸟变成了浣熊。Gemini也喜欢忽略事情,比如即使有标记为"人递送包裹"的视频,也拒绝承认有包裹递送。

Gemini仍然拒绝承认它错了。
归根结底,Gemini正确标记了大多数片段,因此产生的大多数通知是准确的,尽管有时没有帮助。问题在于"大多数"的反面——仍然有很多错误。其中一些错误促使您检查摄像头——至少,在您对Gemini的虚构感到厌倦之前。它没有节省时间让您了解家中发生的情况,而是浪费了您的时间。为了使这个东西有用,推断性错误不能每天发生。
边学边走
Google表示其目标是让Gemini Home对每个人更好。团队"大力投资于提高准确识别能力",以减少错误通知。该公司还认为,让人们添加自定义说明是解决这一难题的关键部分。也许未来,Gemini Home会更加诚实,但目前需要大量引导才能使其朝着正确的方向发展。
通过仔细调整,您确实可以解决Gemini Home的一些异想天开。在调整后,我看到鹿的识别减少了,几个自定义说明使家庭简报浪费较少的空间告诉我人们进出不存在的房间。但我仍然不知道如何提示Gemini让它在空房间里看不到人。

Gemini AI功能适用于所有Nest摄像头,但新的2025型号是"为Gemini设计的。"
尽管Google有意改进Gemini Home,但它发布的产品在开箱即用时效果不佳,其行为方式确实令人反感。安全摄像头不应该谎称看到入侵者,当它们无法识别事件时,也不应该说我_在_撒谎。Ask Home机器人有标准免责声明,建议您验证AI所说的内容。对于Gemini Home,您必须认真对待这个警告。
在发布时,很难证明支付20美元的高级Gemini订阅是合理的。如果您已经支付费用是因为您想要60天的事件历史记录,那么您就被AI通知困住了。不过,您可以忽略每日简报的存在。降至每月10美元的订阅计划,您只能获得30天的事件历史记录,使用旧的非生成式通知和事件标记。也许这是目前更明智的智能家居选择。
Gemini Home对于那些在Home应用中选择早期访问的用户广泛可用。因此,您目前可以避免使用Gemini,但Google为所有人开启开关只是时间问题。
希望到那时它能更好地工作。
结论:AI智能家居的现在与未来
Gemini Home的案例揭示了当前生成式AI技术在智能家居应用中的局限性。尽管Google承诺持续改进,但目前的AI识别准确率仍远未达到可靠实用的标准。将宠物误认为野生动物、将空房间标记为有人闯入等问题,不仅影响了用户体验,更对家庭安全造成了潜在威胁。
对于普通消费者而言,是否应该为Gemini Home的高级功能支付每月20美元的订阅费?从目前的体验来看,答案可能是否定的。除非您确实需要60天的事件历史记录,否则更经济的10美元计划可能是更好的选择,至少它不会给您带来不必要的恐慌。
随着AI技术的不断发展,我们期待未来的智能家居AI能够更加准确地识别场景、理解上下文,并提供真正有用的服务。但在那一天到来之前,消费者需要保持警惕,对AI系统的输出保持批判性思维,不要盲目信任这些仍在学习中的技术。
智能家居的未来无疑是AI驱动的,但我们需要的是能够真正理解家庭环境、提供可靠服务的AI助手,而不是频繁制造幻觉的"数字管家"。Google和其他科技巨头需要认真对待这些问题,在将AI技术推向市场之前,确保它们能够真正解决用户问题,而不是创造新的困扰。










