OpenAI发布Atlas浏览器:AI如何重塑网络浏览体验

1

在2008年,谷歌推出Chrome浏览器以更好地将其行业领先的搜索引擎融入网络浏览体验。如今,OpenAI宣布了Atlas浏览器,希望它能为ChatGPT大语言模型做类似的事情,回答OpenAI团队提出的问题:'如果我能够与浏览器对话会怎样?'

OpenAI创始人兼CEO萨姆·奥尔特曼(Sam Altman)在直播发布会上表示,Atlas将让用户能够'与页面对话',帮助ChatGPT成为用户与在线'大量工作和生活发生'的地方交互的核心方式。他说:'我们希望人们未来使用互联网的方式...是聊天体验和网络浏览器可以成为一个很好的类比。'

这款新浏览器现已可在macOS上下载,奥尔特曼承诺Windows和移动版本将'尽快'推出。

随你而行的语言模型

新Atlas标签页的主屏幕模仿了Chrome搜索框的简洁性,有一个文本字段提示用户'询问ChatGPT或输入网址'。用户可以使用类似于ChatGPT.com的界面访问聊天历史或不同的ChatGPT模型。Atlas浏览器还将在该搜索框下方填充建议,范围从新闻故事链接到浏览器可以为您执行的任务建议。

Atlas浏览器新标签页体验

在直播过程中,OpenAI团队表示,Atlas具备网络用户期望浏览器具有的功能:标签页、书签和自动填充等。但现在与ChatGPT的集成意味着'聊天体验在浏览过程中无处不在'。

这意味着您可以使用ChatGPT通过人类可解析的语言提示搜索书签或浏览历史。这也意味着您可以在当前页面旁边打开一个'侧边聊天',并提出依赖于该特定页面上下文的问题。如果您想使用ChatGPT编辑Gmail草稿,现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制粘贴。

Atlas浏览器让ChatGPT直接在Gmail窗口中编辑文本

Atlas的默认搜索体验包含更传统结果的标签页。

当输入简短的搜索提示时,Atlas默认将作为大语言模型回复,提供带有适当嵌入链接来源的书面答案(类似于OpenAI现有的搜索功能)。但浏览器还将提供包含更传统链接列表、图片、视频或新闻的标签页,就像您从没有LLM功能的搜索引擎中获得的那样。

让我们为您浏览

在直播演示结束时,OpenAI团队展示了Atlas的'代理模式'(Agent Mode)。虽然这个'预览模式'功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃思(Will Ellsworth)表示,他希望它最终能帮助用户朝着'一个让生活变得轻松的神奇工具'迈进,就像LLM编码工具已成为'轻松编码'的工具一样。

为此,团队展示了浏览器将Google Docs表格中编写的规划任务在几分钟内转移到任务管理软件Linear的过程。代理模式还被展示从食谱网页提取配料列表,并在另一个标签页中直接添加到用户的Instacart购物车中(尽管演示代理在结账前停下来等待用户批准)。

Atlas的代理模式接管任务,从一个网络应用程序转移到另一个

Atlas的代理模式将食谱中的商品添加到用户的Instacart购物车中。

Atlas用户可以观看代理模式在各种标签页和网页之间点击,随时接管,或者让它无监督地在后台运行。用户可以使用下拉菜单直接激活代理模式,但当用户提示暗示可能有帮助的任务时,ChatGPT也可以建议开启它。

OpenAI团队表示,代理模式可以像人类用户一样点击浏览,完全访问该用户的身份验证和浏览历史。但OpenAI表示,代理模式只能在网页标签内运行,无法在浏览器外执行代码。您还可以手动控制新的Atlas标签页是否已'登录'或'注销'各种其他网络服务,并使用隐身窗口进行不希望LLM记住的浏览。

竞争激烈的领域

浏览器领域的现有竞争对手一直在尝试将类似的AI功能整合到其产品中一段时间:微软在内置Copilot版本的Edge浏览器,谷歌在Chrome基础上承诺未来几个月将包括'代理功能'的Gemini功能。许多初创公司也专注于从头开始构建AI驱动的浏览器,最引人注目的是Perplexity,尽管其总市场估值仅为1400万美元,但最近大胆提出以345亿美元收购Chrome

值得注意的是,OpenAI在去年4月公开表达了对收购Chrome的兴趣,尽管该反垄断案的最新法律更新意味着谷歌现在似乎不太可能在未来近期出售。

《The Information》去年报道了OpenAI的浏览器计划,路透社在7月援引匿名来源提供了更多信息。路透社指出,浏览器将使OpenAI能够更直接地访问有价值的用户数据,超出了输入ChatGPT提示窗口的内容,并可能为将广告整合到ChatGPT体验提供简单途径。但当然,这取决于ChatGPT每周7亿多活跃用户中有多少人愿意放弃当前浏览器,转而使用来自主要LLM品牌的经验较少的竞争对手。

Atlas浏览器对网络浏览的深远影响

OpenAI的Atlas浏览器不仅仅是一个新的网络工具,它代表了人机交互方式的根本性转变。通过将大语言模型深度集成到浏览体验中,Atlas模糊了搜索、浏览和对话之间的界限,创造了一种更加自然、直观的网络交互方式。

从被动浏览到主动对话

传统浏览模式要求用户主动寻找信息,通过关键词搜索、点击链接来导航。而Atlas引入的'与页面对话'功能,允许用户直接向网页内容提问,就像与真人交谈一样。这种转变不仅提高了信息获取的效率,还降低了技术使用门槛,使更多用户能够轻松获取所需信息。

代理模式:互联网的自动化助手

Atlas的Agent模式是其最具革命性的功能之一。它能够理解用户意图,自动执行跨网站任务,如将Google Docs中的规划任务转移到Linear,或从食谱网站提取配料添加到Instacart。这种自动化能力不仅节省用户时间,还预示着互联网服务整合的新方向——从分散的应用程序生态向更加协同、智能的系统演进。

数据隐私与安全的平衡

随着浏览器功能的增强,数据隐私和安全问题也日益凸显。OpenAI通过允许用户手动控制Atlas标签页的登录状态,以及提供隐身窗口选项,试图在提供便利与保护隐私之间取得平衡。然而,随着浏览器能够访问更多用户数据和浏览历史,如何在利用AI能力的同时保护用户隐私,仍是OpenAI需要持续关注的问题。

浏览器市场的重新洗牌

Atlas的推出正值浏览器市场AI功能整合的关键时期。微软Edge、Google Chrome等主流浏览器都在积极引入AI功能,而Perplexity等初创公司则试图从零开始构建AI驱动的浏览器。OpenAI的进入不仅加剧了这一领域的竞争,也可能促使整个行业重新思考浏览器的本质和未来发展方向。

结语:网络浏览的智能化未来

OpenAI的Atlas浏览器代表了网络浏览体验的一次重大飞跃。通过将ChatGPT的强大能力与浏览器的基础功能相结合,Atlas不仅改变了我们与互联网交互的方式,也预示了AI技术在未来数字生活中的更广泛应用。

随着Agent模式的不断完善和更多用户数据的积累,Atlas有望成为用户数字生活的智能中心,帮助用户更高效地管理信息、完成任务。然而,这一愿景的实现不仅依赖于技术进步,还需要解决数据隐私、安全性和用户信任等挑战。

在未来的网络浏览生态中,我们可能会看到更多类似Atlas的智能浏览器出现,它们将不再仅仅是一个信息获取的工具,而是成为用户的智能代理,理解用户需求,主动提供帮助,甚至预测用户意图。这种转变不仅将重塑浏览器市场,也将深刻影响整个互联网的发展方向。

Atlas浏览器侧边聊天功能

Atlas的侧边聊天功能允许用户就当前网页向ChatGPT提问。