在生成式AI热潮席卷科技行业的今天,几乎所有产品和服务都在整合AI功能。Google推出的Gemini Home服务试图将这一技术应用到家庭智能设备中,为付费用户提供基于摄像头视频的AI分析功能。然而,经过实际测试,这项服务展现出令人担忧的误判能力,将宠物识别为野生动物,将空房间报告为有人入侵,甚至否认已发生的事件。
Gemini Home服务概述
Gemini Home是Google将其Gemini AI模型与智能家居设备整合的尝试,主要面向Google Home应用的付费用户。这项服务提供两种订阅计划:基础版每月10美元,提供30天的视频历史记录;高级版每月20美元,提供60天的视频历史记录以及AI生成的事件摘要和通知。

高级订阅用户可以获得"每日简报",总结一天内家中发生的重要事件;"Ask Home"功能则允许用户通过自然语言查询家中发生的事件;AI生成的事件标签和通知功能则能自动识别并标记视频中的人物、动物和物体。
值得注意的是,Gemini模型仅处理视频的视觉元素,不包含音频分析。这一设计可能是为了保护用户隐私,确保对话内容不会被AI记录和分析。
AI误判:从"鹿闯入客厅"说起
在使用Gemini Home的过程中,最令人啼笑皆非的误判莫过于将我的狗识别为鹿。在第一份"每日简报"中,Gemini郑重其事地报告:"意外地,一只鹿短暂地进入了家庭室。"

这种混淆并非偶然。Gemini有时能正确识别我的狗,但在许多事件摘要中,仍然坚持报告鹿出现在房屋周围和院子里。这不禁让人思考:AI是否真正"理解"它所看到的内容,还是仅仅在匹配视觉模式?
Google发言人解释道:"整体识别准确性取决于多个因素,包括摄像头片段中可供Gemini处理的视觉细节。作为大型语言模型,Gemini有时会做出推断错误,导致这些误识别,例如将您的狗与猫或鹿混淆。"
安全警报:AI制造的虚假入侵
比将狗识别为鹿更令人担忧的是,Gemini有时会将空房间或阴影误判为有人入侵。当您外出时收到通知"有人在家庭室",那种恐慌感可想而知。检查摄像头后却发现什么都没有,这种经历不仅令人沮丧,更逐渐削弱了用户对系统的信任。

在测试过程中,我多次看到Gemini将狗和完全空的房间(也许是阴影?)误判为一个人。虽然最初可能令人警觉,但几次误报后,您会开始怀疑这个AI系统。现在,即使Gemini正确识别了家中的陌生人,我可能也会忽略它。
更令人不安的是,Gemini有时会否认已发生的事件。例如,当视频标记为"人递送包裹"时,Gemini仍坚称没有包裹送达。
AI幻觉的技术根源
Gemini Home的这些问题反映了当前生成式AI的根本局限。与人类不同,AI缺乏常识推理能力。当一个人看到其他视频中狗在活动后,再看新视频时不会认为看到的是鹿。但Gemini没有这种常识基础,如果标记指向"鹿",它就会报告鹿。
有趣的是,Gemini在识别汽车型号和品牌标志方面表现出色,这表明它在某些特定任务上表现良好,但在理解复杂场景和上下文时却显得力不从心。
Google承认这些问题,并表示正在"大力投资提高识别准确性",减少错误通知。公司还认为,允许用户添加自定义说明是解决问题的关键。然而,在当前版本中,即使经过仔细调整,Gemini仍然无法完全避免误判。
用户体验与实用价值评估
从用户体验角度看,Gemini Home目前的价值令人质疑。虽然它能正确标记大多数事件片段,产生基本准确但有时无用的通知,但"大多数"的另一面仍然是大量错误。这些错误迫使您不断检查摄像头,反而浪费了时间。
"Ask Home"功能在创建自动化方面表现较好,能够根据自然语言请求设置自动化规则。这可能是由于可能的自动化元素有限,AI在这方面能正确处理。
然而,对于主要功能——事件识别和通知,Gemini Home的表现难以令人满意。Google发言人表示,用户无法在不关闭基础通知的情况下关闭AI描述,但可以在应用中禁用人脸检测相关通知。
隐私与数据安全考量
在数据使用方面,Google表示不会将用户的视频用于训练,除非用户通过Home应用中的一个不显眼选项选择"借出"这些视频。在这种情况下,Google会保留这些视频长达18个月或直到用户撤销访问权限。不过,用户与Gemini的互动(如输入的提示和对输出的评级)会被用于改进模型。
这种数据使用方式引发了对隐私保护的担忧。即使Google承诺不滥用数据,用户仍然需要谨慎考虑是否愿意让AI系统分析家庭监控视频。
购买建议:是否值得订阅?
在当前状态下,很难证明每月20美元的Gemini高级订阅是值得的。如果您已经因为需要60天的事件历史而付费,那么您必须接受AI通知。不过,您可以忽略"每日简报"的存在。
降级至每月10美元的订阅计划,您将获得30天的事件历史记录,以及传统的非生成式通知和事件标记。对于大多数用户来说,这可能是目前更明智的选择。
未来展望与改进方向
Google承诺将改进Gemini Home的识别准确性,减少误判。未来版本可能会通过更好的模型训练、更精细的用户自定义选项以及更准确的事件识别算法来提升性能。
此外,Google可能需要重新考虑AI通知的设计,提供更明确的置信度指标,让用户能够区分高可信度的事件和可能存在误判的事件。同时,提供更灵活的通知设置,让用户能够自定义哪些类型的事件需要AI分析,哪些不需要。
结论:AI与家居安全的现实距离
Gemini Home案例揭示了生成式AI在理解现实世界方面的重大挑战。虽然AI技术在特定任务上表现出色,但在理解复杂家庭场景、进行常识推理和准确识别事件方面仍有很长的路要走。
对于消费者而言,在考虑采用这类AI增强的家居安全服务时,应保持理性期待,了解其局限性,并做好应对误判的准备。在AI技术完全成熟之前,传统的事件标记和通知系统可能仍然是更可靠的选择。
随着技术的不断进步,我们有理由相信未来的AI家居安全系统会更加准确和可靠。但在那一天到来之前,Gemini Home提醒我们:AI不是完美的,有时甚至会产生令人啼笑皆非或令人不安的幻觉。在将AI系统应用于家庭安全这一关键领域时,谨慎和理性永远是最好的策略。








