OpenAI发布Atlas浏览器:AI与网页浏览的完美融合

0

在2008年,谷歌推出Chrome浏览器以帮助将其行业领先的搜索引擎更好地整合到网页浏览体验中。如今,OpenAI宣布了Atlas浏览器,希望这款产品能为ChatGPT大型语言模型做类似的事情,正如OpenAI团队所描述的,回答'如果我能与浏览器对话会怎样?'这个问题。

OpenAI创始人兼CEO萨姆·奥尔特曼(Sam Altman)在直播宣布中表示,Atlas将让用户'与页面对话',帮助ChatGPT成为用户与'大量工作和生活在线发生'的场所互动的核心方式。他说:'我们希望人们未来使用互联网的方式...是聊天体验和网页浏览可以成为一个很好的类比。'

这款新浏览器现已可在macOS上下载,奥尔特曼承诺Windows和移动版本将'尽快'推出。

随你而动的语言模型

新Atlas标签页的主屏幕模仿了Chrome搜索框的简洁性,有一个文本字段提示用户'询问ChatGPT或输入网址'。用户可以使用类似于ChatGPT.com的界面访问聊天历史或不同的ChatGPT模型。Atlas浏览器还将在该搜索框下方填充建议,范围从新闻报道链接到浏览器可以为您执行的任务建议。

在直播中,OpenAI团队表示,Atlas具备网络用户对浏览器的期望功能:标签页、书签和自动填充等。但现在与ChatGPT的集成意味着'聊天体验在浏览过程中无处不在'。

这意味着您可以使用ChatGPT使用人类可解析的语言提示搜索书签或浏览历史。这也意味着您可以在当前页面旁边打开'侧边聊天',并提出依赖于该特定页面上下文的问题。如果您想使用ChatGPT编辑Gmail草稿,现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制和粘贴。

让我们为您浏览

在直播演示的最后,OpenAI团队展示了Atlas的'代理模式'(Agent Mode)。虽然这个'预览模式'功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃斯(Will Ellsworth)表示,他希望最终能帮助用户朝着'一个让生活变得轻松的神奇工具'迈进,就像LLM编码工具已成为'轻松编码'的工具一样。

为此,团队展示了浏览器将Google表格中编写的规划任务在几分钟内转移到任务管理软件Linear的过程。代理模式还被展示从食谱网页获取配料列表,直接添加到用户在不同标签页中的Instacart购物车中(尽管演示代理在结账前停止以获得用户批准)。

Atlas用户可以观看代理模式在各种标签页和网页间点击,随时接管操作,或者让它在后台运行而无需监督。用户可以使用下拉菜单直接激活代理模式,但当用户提示暗示可能有帮助的任务时,ChatGPT也可以建议开启此功能。

OpenAI团队表示,代理模式可以像人类用户一样点击浏览,完全访问该用户的身份验证和浏览历史。但OpenAI表示,代理模式只能在网页标签页内运行,无法在浏览器外执行代码。您还可以手动控制新的Atlas标签页是否已'登录'或'退出'各种其他网络服务,并使用隐身窗口进行不希望LLM记住的浏览。

竞争激烈的战场

浏览器领域的现有竞争对手已经尝试将类似的AI功能整合到其产品中有一段时间了:微软在内置Copilot版本的Edge浏览器,谷歌在Chrome中基于Gemini的功能承诺将在未来几个月内包含'代理功能'。许多初创公司也专注于从头开始构建AI驱动的浏览器,最引人注目的是Perplexity,尽管其总市值仅为1400万美元,但最近却大胆提出以345亿美元竞购Chrome

值得注意的是,OpenAI曾在4月公开表达了对收购Chrome的兴趣,但该反垄断案件中的最新法律更新意味着谷歌现在似乎不太可能在近期出售。

《The Information》去年报道了OpenAI的浏览器计划,路透社在7月也根据匿名来源提供了更多信息。路透社指出,浏览器将使OpenAI能够获得比输入ChatGPT提示窗口更直接的有价值用户数据访问,并提供一种将广告整合到ChatGPT体验的简单方式。但当然,这都取决于ChatGPT超过7亿的每周活跃用户中有多少人愿意放弃当前浏览器,转而使用来自主要LLM品牌的这个不太成熟的竞争对手。

Atlas的技术革新

Atlas浏览器的核心创新在于其深度集成的AI功能,这不仅仅是简单地添加一个侧边栏聊天工具。通过将ChatGPT直接嵌入浏览器内核,OpenAI实现了对网页内容的实时理解和交互。这种集成允许用户以自然语言方式与整个网页内容进行对话,而不仅仅是单个页面。

从技术角度看,Atlas采用了先进的上下文理解算法,能够同时处理多个标签页的信息,并根据用户需求提供跨页面的智能建议。例如,当用户在一个标签页阅读产品评论,同时在另一个标签页比较价格时,Atlas可以自动汇总关键信息,提供购买建议。

用户体验的重塑

Atlas浏览器彻底改变了传统网页浏览的交互模式。用户不再需要在多个应用和窗口间切换来完成简单任务。例如,用户可以直接在浏览网页时要求ChatGPT总结文章要点、提取关键数据,甚至基于网页内容生成报告或邮件草稿。

'侧边聊天'功能允许用户在不离开当前页面的情况下获取相关信息或执行操作。这种设计大大减少了认知负荷,使用户能够更专注于内容本身,而非操作流程。对于研究人员、学生和内容创作者等需要大量网络信息处理的用户群体,这种体验尤为宝贵。

商业模式的探索

尽管Atlas目前主要专注于提升用户体验,但其背后也隐藏着潜在的商业模式。通过直接访问用户的浏览行为和偏好,OpenAI可以获得更精准的用户画像,为未来可能推出的个性化服务或广告系统奠定基础。

此外,Atlas的代理模式为自动化服务提供了新思路。未来,OpenAI可能通过订阅模式提供更高级的代理功能,如自动购物比价、行程规划、内容创作辅助等。这种模式不仅能创造新的收入来源,也能进一步巩固ChatGPT作为AI助手的市场地位。

行业影响与未来展望

Atlas的发布标志着AI与互联网融合进入新阶段。传统浏览器主要关注信息获取和展示,而Atlas则强调理解和交互。这种转变可能会重新定义用户与互联网的关系,从被动接收信息转变为主动与内容对话。

对于行业而言,Atlas的出现加剧了科技巨头在AI浏览器领域的竞争。微软、谷歌等公司可能会加速其AI功能的迭代,而专注于AI浏览器的初创公司则需要找到差异化竞争点。未来,我们可能会看到更多专业化、场景化的AI浏览器出现,针对特定用户群体或行业需求提供定制化服务。

从更宏观的角度看,Atlas代表了AI从工具向平台的演进。通过深度整合到日常使用的工具中,AI正逐步成为数字生活的基础设施。这种趋势可能会在未来几年内继续深化,最终实现AI与人类工作生活的无缝融合。