在2008年,谷歌推出Chrome浏览器是为了将其行业领先的搜索引擎更好地集成到网络浏览体验中。如今,OpenAI宣布了Atlas浏览器,希望这款产品能为ChatGPT大语言模型实现类似的功能,正如OpenAI团队所设想的回答'如果我能与浏览器对话会怎样?'这个问题。
OpenAI创始人兼CEO萨姆·奥特曼(Sam Altman)在直播发布会上表示,Atlas将让用户能够'与页面对话',帮助ChatGPT成为用户与在线'大量工作和生活发生的地方'互动的核心方式。他说:'我们希望人们未来使用互联网的方式...是聊天体验和网络浏览器可以成为一个很好的类比。'
这款新浏览器现已可从macOS平台下载,奥特曼承诺Windows和移动版本将尽快推出。
跟随你的大语言模型

新浏览器的新标志。图片来源:OpenAI
Atlas新标签页的主屏幕模仿了Chrome搜索框的简洁性,有一个文本字段提示用户'询问ChatGPT或输入URL'。用户可以使用类似于ChatGPT.com的界面访问聊天历史或不同的ChatGPT模型。Atlas浏览器还会在搜索框下方填充建议,这些建议可能从新闻报道链接到浏览器可以为您执行的任务建议。
在直播中,OpenAI团队表示,Atlas具备网络用户已经习惯的浏览器功能:标签页、书签和自动填充等。但现在与ChatGPT的集成意味着'聊天体验在浏览过程中无处不在'。
这意味着您可以使用ChatGPT通过人类可解析的语言提示来搜索书签或浏览历史。这也意味着您可以在当前页面旁边打开一个'侧边聊天',并提出依赖于该特定页面上下文的问题。如果您想使用ChatGPT编辑Gmail草稿,现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制粘贴。

Atlas浏览器界面展示。图片来源:OpenAI
Atlas还提供了一种新的搜索体验,当用户输入简短的搜索提示时,默认情况下会以大语言模型(LLM)的形式回复,提供包含适当来源链接的书面回答(类似于OpenAI现有的搜索功能)。但浏览器也会提供包含更传统链接列表、图片、视频或新闻的标签页,就像您从没有LLM功能的搜索引擎获得的结果一样。
让我们为您浏览

让ChatGPT直接在Gmail窗口编辑文本。图片来源:OpenAI
在直播演示的结尾,OpenAI团队展示了Atlas的Agent模式。虽然这个'预览模式'功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃斯(Will Ellsworth)表示,他希望最终能帮助用户实现'一个让生活更轻松的神奇工具',就像LLM编码工具已成为'轻松编码'的工具一样。
为此,团队展示了浏览器如何将Google Docs表格中编写的规划任务在几分钟内转移到任务管理软件Linear。Agent模式还被展示从食谱网页获取食材列表,并在另一个标签页中直接添加到用户的Instacart购物车中(尽管演示Agent在结账前停下以获得用户批准)。

Atlas的Agent模式在不同网页应用间转移规划任务。图片来源:OpenAI

Atlas的Agent模式将食谱中的物品添加到用户的Instacart。图片来源:OpenAI
Atlas用户可以观看Agent模式在各种标签页和网页之间点击操作,随时接管,或者让它在后台运行而无需监督。用户可以使用下拉菜单直接激活Agent模式,但当用户提示暗示可能有任务需要帮助时,ChatGPT也可以建议开启此功能。
OpenAI团队表示,Agent模式可以像人类用户一样点击浏览,完全访问该用户的身份验证和浏览历史。但OpenAI表示,Agent模式只能在网页标签页内运行,无法在浏览器外执行代码。用户还可以手动控制新的Atlas标签页是否已'登录'或'退出'各种其他网络服务,并使用隐身窗口进行不希望LLM记住的浏览。
竞争激烈的领域

Atlas浏览器的新标签页体验,包含一些建议。图片来源:OpenAI
浏览器领域的现有竞争对手一直在尝试将类似的AI功能整合到他们的产品中:微软将其Copilot版本内置到Edge浏览器中,谷歌则承诺Chrome基于Gemini的功能将在未来几个月内包括'代理功能'。许多初创公司也专注于从头开始构建AI驱动的浏览器,最引人注目的是Perplexity,尽管其总市场估值仅为1400万美元,但最近却大胆出价345亿美元收购Chrome。
值得注意的是,OpenAI曾在4月公开表达了对收购Chrome的兴趣,不过该反垄断案件最近的法律更新意味着谷歌在近期似乎不太可能出售。
《The Information》去年报道了OpenAI的浏览器计划,路透社在7月根据匿名来源的信息进行了跟进报道。路透社指出,浏览器将使OpenAI能够直接获取宝贵的用户数据,这些数据超出了输入ChatGPT提示窗口的内容,并提供一种简单的方式将广告整合到ChatGPT体验中。但当然,这都取决于ChatGPT的7亿多周活跃用户中有多少人愿意放弃当前浏览器,转而使用来自主要LLM品牌的不太成熟的竞争对手。
技术革新与市场挑战
Atlas浏览器代表了OpenAI在AI应用领域的一次重大扩张尝试。与传统的搜索引擎不同,Atlas不仅仅提供链接列表,而是直接提供基于用户问题的答案,并能在网页上下文中执行操作。这种'对话式浏览'模式可能会彻底改变用户与互联网内容互动的方式。
从技术角度看,Atlas浏览器集成了OpenAI最先进的语言模型,实现了真正的上下文理解和操作执行。Agent模式的出现更是预示着网络浏览自动化的重要一步,虽然目前仍处于早期阶段,但其潜力巨大。用户可以想象未来通过简单的自然语言指令,Agent就能完成复杂的网络任务,如在线购物、信息收集、内容创作等。
然而,OpenAI也面临着严峻的市场挑战。谷歌和微软已经在各自的浏览器中整合了AI功能,拥有庞大的用户基础和生态系统支持。同时,像Perplexity这样的初创公司也在积极创新,试图在AI浏览器领域占据一席之地。对于OpenAI来说,Atlas浏览器不仅是一款产品,更是一场与科技巨头的竞争,关乎其在AI应用领域的领导地位。
未来展望
Atlas浏览器的发布标志着OpenAI从单纯的AI模型提供商向全方位AI应用平台转变的重要一步。未来,我们可以预见更多基于大语言模型的智能应用将出现在我们的数字生活中,而浏览器作为连接用户与互联网的主要入口,其智能化程度将直接影响用户体验。
随着技术的不断进步,Agent模式可能会变得更加智能和自主,能够处理更复杂的任务,甚至理解用户的隐式需求。同时,隐私和安全问题也将成为关注的焦点,如何在提供便利的同时保护用户数据,将是OpenAI需要认真考虑的问题。
总的来说,OpenAI Atlas浏览器代表了AI技术在网络浏览领域的一次大胆尝试,它不仅是对现有浏览体验的革新,更是对未来人机交互方式的一种探索。无论最终市场表现如何,这一创新都将推动整个行业向前发展,为用户带来更加智能、便捷的互联网体验。









