Google近日宣布,Chrome浏览器将迎来史上最大规模的AI功能升级,Gemini AI技术将深度整合至浏览器的每个环节。这一变革不仅标志着Chrome向AI浏览器转型的开始,也可能重新定义用户与互联网的交互方式。
Gemini按钮:跨标签页智能助手
最显著的变化是在桌面浏览器中新增了Gemini按钮。点击此按钮会打开一个弹出窗口,用户可以向Gemini询问关于已打开标签页内容的问题,并获取内容摘要。这一功能已在Android系统层面实现,而Google表示iOS版的Gemini应用也将很快内置到Chrome中。
Gemini的功能不仅限于当前标签页。Google的目标是使用户能够在不离开当前屏幕的情况下与其他应用和标签页交互。当用户在Chrome中调用Gemini时,它可以处理所有打开标签页中的内容,并与Google Calendar、YouTube等产品建立连接。此外,它还能根据模糊的记忆在浏览历史中查找相关链接。
AI搜索模式:重新定义网络搜索
Chrome的AI模式正逐步成为Google的默认网络搜索方式。更新后的Chrome现在允许用户从地址栏(AI omnibar)开始AI模式搜索。虽然目前需要点击按钮才能激活AI模式,但Google未来可能会轻松用AI模式替代传统搜索。
地址栏还将新增"询问此页面"功能。Chrome可以提出相关问题(目前仅支持英文),并在侧边栏显示答案。回答自然以AI概览开头,用户还可以在AI模式下提出后续问题。
AI安全防护:智能识别威胁
Google表示正在利用AI加强Chrome的安全性。Gemini工具已能识别常见的技术支持诈骗。更新的Gemini Nano模型将扩展这些检测功能,以识别虚假病毒警报和虚假赠品活动。
Chrome的密码管理器已能告知用户密码是否泄露,而经过AI改造后,它还可以一键自动更改密码。不过,这种自动化操作也可能带来潜在风险。
代理控制:浏览器自动化新纪元
Chrome的下一个创新将需要更长时间实现。Google表示,将于今年晚些时候为Chrome添加代理控制功能。
过去一年,我们已经看到了几种"使用代理"系统,包括OpenAI的Operator和Anthropic的Claude for Chrome。这些系统理论上可以控制电脑光标,代表用户完成任务。Google建议将Chrome代理用于繁琐或重复性任务,如预约理发或订购杂货。用户只需输入请求,即可观看代理操作(某种程度上)。
代理控制的挑战与前景
目前,使用代理面临两个主要问题:速度慢和成本高。这些是生成式AI系统,即使处理大量昂贵的token,它们的表现也不完美。OpenAI的Operator仅适用于每月200美元订阅的有限使用,而Anthropic的代理在完成访问少量网页等简单操作时可能会产生几美元的API费用。
我们尚不清楚Google的Chrome代理将有多可靠或快速,也没有关于额外成本的任何信息。Google的博客文章甚至没有提到将此功能限制给订阅用户,但它对其许多AI工具有模糊的限制。Google已就此点寻求澄清。
尽管Google的浏览代理助手可能不会比竞争对手的产品更好,但Chrome的普及将使这项技术面向更多用户。但它真的适用于所有人吗?这家公司在通过烧钱来立足AI领域并不陌生,但允许数十亿人尝试使用昂贵的计算机使用模型,即使是Google也可能难以推销。
行业影响与未来展望
Chrome的全面AI化将对浏览器行业产生深远影响。随着Chrome占据全球浏览器市场的主导地位,其AI功能的普及速度将远超竞争对手。这不仅可能改变用户的浏览习惯,还可能推动整个行业向AI驱动的交互模式转型。
然而,这一转型也面临诸多挑战:如何平衡AI功能与用户隐私保护,如何提高AI代理的效率和可靠性,以及如何控制大规模部署AI功能的成本,都是Google需要解决的问题。
随着AI技术的不断发展,我们有理由相信,Chrome的这次AI升级只是浏览器智能化的开始。未来,我们可能会看到更多AI原生功能的加入,以及更自然、更高效的人机交互方式的出现。Chrome的AI时代,已经拉开序幕。