
2008年,Google推出Chrome浏览器,旨在将其行业领先的搜索引擎更好地融入网页浏览体验。如今,OpenAI发布了Atlas浏览器,希望能为其ChatGPT大语言模型实现类似的目标,正如OpenAI团队所描述的,回答了"如果我能够与浏览器对话会怎样?"的问题。
OpenAI创始人兼CEO萨姆·奥特曼在一次直播发布会上表示,Atlas将让用户"与网页对话",帮助ChatGPT成为用户与线上"大量工作和生活发生"的地方互动的核心方式。"我们希望人们未来使用互联网的方式……是聊天体验和网页浏览器能够成为一个很好的类比,"他说道。
这款新浏览器现已可在macOS平台下载,奥特曼承诺Windows和移动版本将"尽快推出"。
跟随你的LLM
Atlas新标签页的主屏幕镜像了Chrome搜索框的简洁性,有一个文本字段提示用户"询问ChatGPT或输入URL"。用户可以使用类似于ChatGPT.com上的界面访问他们的聊天历史或不同的ChatGPT模型。Atlas浏览器还会在该搜索框下方填充建议,这些建议可能从新闻故事链接到浏览器可以为您执行的任务建议。
在直播中,OpenAI团队表示,Atlas具有网页用户期望从浏览器中获得的功能:标签页、书签和自动填充等。但与ChatGPT的集成现在意味着"聊天体验伴随着你浏览的每一个角落"。
这意味着你可以使用ChatGPT通过人类可解析的语言提示来搜索你的书签或浏览历史。这也意味着你可以在当前页面旁边调出"侧边聊天",并询问依赖于该特定页面上下文的问题。如果你想使用ChatGPT编辑Gmail草稿,你现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制粘贴。

当输入简短的搜索提示时,Atlas默认会以LLM的形式回复,提供书面答案并在适当的地方嵌入来源链接(类似于OpenAI现有的搜索功能)。但浏览器也会提供标签页,包含更传统的链接列表、图片、视频或新闻,就像你从没有LLM功能的搜索引擎中获得的那样。

让我们来为你浏览
在直播演示的最后,OpenAI团队展示了Atlas的Agent模式。虽然这个"预览模式"功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃思表示,他希望最终能帮助用户实现"生活化处理的绝佳工具",就像LLM编码工具已成为"氛围编码"的工具一样。
为此,团队展示了浏览器在几分钟内将写在Google Docs表格中的计划任务移动到任务管理软件Linear中。Agent模式还被展示从食谱网页获取成分列表,并将其直接添加到用户在另一个标签页中的Instacart购物车中(尽管演示Agent在结账前停止以获得用户批准)。

Atlas用户可以观看Agent模式点击各种标签页和网页,随时接管操作,或者让它在后台无需监督地运行。用户可以直接使用下拉菜单激活Agent模式,但当用户提示表明可能有帮助的任务时,ChatGPT也可以建议打开它。
OpenAI团队表示,Agent模式可以像人类用户一样四处点击,完全访问该用户的身份验证和浏览历史。但OpenAI表示,Agent模式只能在网页标签内操作,不能在浏览器外执行代码。您还可以手动控制新的Atlas标签页是否"登录"或"退出"各种其他网络服务,并使用隐身窗口进行您不希望LLM记住的浏览。
竞争激烈的领域
浏览器领域的老牌竞争对手已经尝试将类似的AI功能整合到他们的产品中一段时间了:微软通过内置在Edge浏览器中的Copilot版本,谷歌通过基于Chrome的Gemini功能,后者承诺在未来几个月内将包括"代理功能"。许多初创公司也专注于从头开始构建AI驱动的浏览器,最著名的是Perplexity,该公司最近尽管总市值仅为1400万美元,却大胆出价345亿美元收购Chrome。
OpenAI还值得注意的是,今年4月公开表示有兴趣收购Chrome,尽管最近该反垄断案件的法律更新意味着谷歌现在似乎不太可能在近期出售。
《信息报》去年报道了OpenAI的浏览器计划,路透社随后在7月份援引未具名来源提供了更多信息。路透社指出,浏览器将使OpenAI能够更直接地访问有价值的用户数据,而不仅仅是在ChatGPT提示窗口中输入的内容,并且可以提供一种简单的方式将广告整合到ChatGPT体验中。但当然,这一切都取决于ChatGPT的7亿多周活跃用户中有多少人愿意放弃他们当前的浏览器,转而选择来自主要LLM品牌的经验较少的竞争对手。

技术创新与用户体验
Atlas浏览器的推出标志着OpenAI在硬件与软件整合方面的战略扩展。通过将ChatGPT直接嵌入浏览器环境,OpenAI不仅提升了用户与网页内容的互动方式,还为AI助手提供了更广阔的应用场景。这种深度整合使得AI不再是独立的应用程序,而是成为用户浏览体验的自然延伸。
在技术层面,Atlas浏览器采用了先进的上下文理解能力,能够实时分析网页内容并提供相关的辅助功能。例如,当用户访问新闻网站时,Atlas可以自动总结文章要点;在购物网站上,它可以比较不同产品的价格和评价;在学术研究页面,它能够帮助用户提取关键数据和引用信息。
市场前景与挑战
尽管Atlas浏览器展现了令人印象深刻的技术创新,但其市场前景仍面临诸多挑战。首先,浏览器市场已被Chrome、Safari、Firefox和Edge等成熟产品高度分割,用户习惯和转换成本构成了巨大的进入壁垒。其次,隐私和数据安全问题将成为用户考虑是否采用Atlas的重要因素,特别是考虑到Agent模式需要访问用户的浏览历史和登录凭证。
然而,OpenAI拥有ChatGPT庞大的用户基础作为潜在优势。如果能够成功说服现有ChatGPT用户迁移到Atlas浏览器,OpenAI可能会在短时间内获得可观的市场份额。此外,随着AI技术在日常生活中的普及,专门为AI优化的浏览器可能会吸引寻求更智能、更高效浏览体验的用户群体。
行业影响与未来展望
Atlas浏览器的推出可能对整个互联网行业产生深远影响。一方面,它可能加速浏览器市场的AI功能竞赛,促使其他浏览器开发商加快其AI整合计划。另一方面,它可能改变用户与互联网内容的互动方式,从传统的点击和浏览转向更加对话式、个性化的体验。
未来,我们可能会看到更多专门为AI助手设计的浏览器功能,如语音控制、多模态交互(结合文本、图像和视频)以及更复杂的自动化任务执行。随着这些技术的发展,浏览器的角色可能从被动的信息展示工具转变为主动的智能助手,帮助用户更高效地导航和利用互联网资源。

结语
OpenAI的Atlas浏览器代表了AI技术与网页浏览体验融合的重要尝试。通过将ChatGPT的强大功能直接嵌入浏览器环境,Atlas不仅为用户提供了更智能、更便捷的浏览方式,也为互联网行业的未来发展指明了方向。尽管面临市场竞争和用户习惯的挑战,Atlas的创新理念和技术实现无疑将对整个行业产生深远影响,推动浏览器向更加智能化、个性化的方向发展。









