OpenAI发布Atlas浏览器:AI与网页浏览的完美融合

1

在2008年,Google推出Chrome浏览器以更好地将其行业领先的搜索引擎整合到网络浏览体验中。如今,OpenAI宣布了Atlas浏览器,希望它能为ChatGPT大语言模型实现类似的功能,正如OpenAI团队所提出的,回答'如果我能与浏览器对话会怎样?'这一问题。

OpenAI创始人兼CEO萨姆·奥特曼(Sam Altman)在直播发布会上表示,Atlas将让用户'与页面对话',帮助ChatGPT成为用户在线交互的核心方式,'我们希望人们未来使用互联网的方式...是聊天体验和网络浏览器可以成为很好的类比。'

这款新浏览器现已可在macOS上下载,奥特曼承诺Windows和移动版本将'尽快'推出。

随你而行的语言模型

新Atlas标签页的主屏幕模仿了Chrome搜索框的简洁性,提供了一个文本字段,提示用户'询问ChatGPT或输入URL'。用户可以使用类似于ChatGPT.com的界面访问聊天历史或不同的ChatGPT模型。Atlas浏览器还将在搜索框下方填充建议,这些内容可能从新闻报道链接到浏览器可以为您执行的任务建议。

在直播中,OpenAI团队表示,Atlas具备网络用户期望浏览器拥有的功能:标签页、书签和自动填充等。但现在与ChatGPT的集成意味着'聊天体验将伴随您的浏览体验无处不在'。

这意味着您可以使用ChatGPT通过人类可解析的语言提示搜索书签或浏览历史。这也意味着您可以在当前页面旁边打开一个'侧边聊天',并提出依赖于该特定页面上下文的问题。如果您想使用ChatGPT编辑Gmail草稿,现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制粘贴。

Atlas浏览器界面

Atlas的默认搜索体验,包含更传统结果的标签页。

Atlas的默认搜索体验,包含更传统结果的标签页。

Atlas浏览器侧边聊天

侧边聊天让您可以就活动网页向ChatGPT提问。

Atlas的默认'新标签页'体验,包含一些建议。

Atlas的默认'新标签页'体验,包含一些建议。

当输入简短搜索提示时,Atlas默认会以大语言模型(LLM)回复,提供带有适当来源链接嵌入的书面答案(类似于OpenAI现有的搜索功能)。但浏览器还将提供包含更传统链接列表、图像、视频或新闻的标签页,就像您从没有LLM功能的搜索引擎获得的那样。

让我们为您浏览

在直播演示的结尾,OpenAI团队展示了Atlas的Agent Mode。虽然这个'预览模式'功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃斯(Will Ellsworth)表示,他希望最终它能帮助用户实现'一个用于生活氛围化的绝佳工具',就像LLM编码工具已成为'氛围编码'的工具一样。

为此,团队展示了浏览器将Google Docs表格中编写的规划任务在几分钟内转移到任务管理软件Linear的过程。Agent Mode还被展示从食谱网页获取食材列表,并在另一个标签页中直接添加到用户的Instacart购物车中(尽管演示Agent在结账前停止以获得用户批准)。

Atlas Agent Mode任务转移

Atlas的Agent Mode接管任务,从一个基于网络的应用转移到另一个。

Atlas的Agent Mode将食谱中的物品添加到用户的Instacart购物车。

Atlas的Agent Mode接管任务,从一个基于网络的应用转移到另一个。

Atlas的Agent Mode将食谱中的物品添加到用户的Instacart购物车。

Atlas用户可以观察Agent Mode在各种标签页和网页间点击操作,随时接管,或者也可以让它在后台运行而无需监督。用户可以使用下拉菜单直接激活Agent Mode,但当用户提示表明可能有任务可以帮助时,ChatGPT也可以建议开启它。

OpenAI团队表示,Agent Mode可以像人类用户一样点击浏览,完全访问该用户的身份验证和浏览历史。但OpenAI表示,Agent Mode只能在网页标签页内运行,无法在浏览器外执行代码。您还可以手动控制新的Atlas标签页是否已'登录'或'退出'各种其他网络服务,并使用隐身窗口进行您不希望LLM记住的浏览。

竞争激烈的战场

浏览器领域的现有竞争对手已尝试将类似的AI功能整合到其产品中一段时间了:微软在Edge浏览器中内置了Copilot版本,谷歌承诺Chrome基于的Gemini功能将在未来几个月内包含'代理功能'。许多初创公司也专注于从头开始构建AI驱动的浏览器,最引人注目的是Perplexity,它最近大胆出价345亿美元收购Chrome,尽管其总市值仅为1400万美元。

值得注意的是,OpenAI曾在4月公开表示有兴趣收购Chrome,尽管该反垄断案的最新法律更新意味着谷歌现在似乎不太可能在近期出售。

《The Information》去年报道了OpenAI的浏览器计划计划,路透社在7月根据匿名来源提供了更多信息。路透社指出,浏览器将为OpenAI提供比输入ChatGPT提示窗口获得的数据更有价值的直接用户数据访问,并提供一种简单的方式将广告整合到ChatGPT体验中。但当然,这一切都取决于ChatGPT7亿多周活跃用户中有多少人愿意放弃当前浏览器,转而选择来自主要LLM品牌的这个不太成熟的竞争对手。

Atlas浏览器的技术创新

Atlas浏览器的推出代表了AI技术与传统网络浏览体验的深度融合。从技术角度看,这一创新主要体现在以下几个方面:

1. 无缝的AI集成

Atlas浏览器最显著的特点是将ChatGPT深度整合到浏览器的核心功能中,而非简单地作为附加工具。这种集成使得用户可以直接与网页内容'对话',获取即时解释、总结或分析。传统浏览器需要用户在不同应用间切换,而Atlas则打破了这一界限,实现了真正的'对话式浏览'。

2. 上下文感知能力

Atlas浏览器能够理解用户当前浏览的网页内容,并提供与该内容相关的智能建议。这种上下文感知能力使得AI助手能够更精准地理解用户需求,提供个性化的服务。例如,当用户阅读一篇技术文章时,Atlas可以自动提供相关术语解释或补充阅读材料。

3. Agent Mode的自动化能力

Agent Mode代表了浏览器技术的未来发展方向——自动化任务执行。通过模拟人类用户的操作方式,Agent Mode可以跨网页、跨应用执行复杂任务,如数据迁移、信息整理等。这不仅提高了工作效率,也为用户创造了全新的数字交互体验。

4. 隐私与安全的平衡

尽管Atlas提供了强大的AI功能,OpenAI也充分考虑了用户隐私和安全问题。用户可以精细控制哪些数据可以被AI访问,哪些操作需要手动确认。这种设计既保证了AI功能的便利性,又维护了用户对个人数据的控制权。

市场影响与行业变革

Atlas的推出不仅是一次产品发布,更可能引发整个浏览器行业的深刻变革。其影响主要体现在以下几个方面:

1. 重新定义浏览器功能

传统浏览器主要关注信息展示和导航功能,而Atlas则将浏览器转变为智能助手和任务执行平台。这一转变将促使其他浏览器厂商加速AI功能的开发,推动整个行业向更智能、更自动化的方向发展。

2. 改变用户上网习惯

Atlas的对话式浏览和自动化任务功能可能改变用户与互联网交互的基本方式。未来,用户可能不再需要手动搜索、筛选和整理信息,而是通过自然语言指令让AI助手完成这些工作。这将大大提高上网效率,也可能减少信息过载问题。

3. 加剧AI竞争格局

OpenAI通过Atlas进入浏览器市场,直接挑战谷歌和微软等科技巨头。这一举动将进一步加剧AI领域的竞争,促使各公司加快技术创新步伐。同时,这也可能导致AI技术与传统互联网服务的融合加速,催生更多创新应用和服务模式。

4. 数据获取与商业模式创新

浏览器是获取用户行为数据的重要渠道。通过Atlas,OpenAI可以收集更丰富的用户交互数据,这些数据对于训练和改进AI模型具有重要价值。同时,Atlas也为新的商业模式提供了可能性,如基于AI功能的订阅服务、精准广告投放等。

未来展望

Atlas浏览器只是OpenAI战略布局的一环。展望未来,我们可以预见以下几个发展方向:

1. 多平台整合

随着Windows和移动版本的推出,Atlas将实现跨平台无缝体验。用户可以在不同设备上获得一致的AI浏览体验,数据和行为模式也将实现同步,为更个性化的服务奠定基础。

2. 功能持续增强

基于用户反馈和AI技术的进步,Atlas的功能将持续增强。未来版本可能会支持更复杂的任务自动化、多模态内容理解(如图像、视频分析)、实时协作等功能,进一步拓展AI在浏览场景中的应用边界。

3. 生态系统建设

OpenAI可能会围绕Atlas构建开发者生态系统,允许第三方开发者为Atlas创建AI插件和扩展。这将丰富Atlas的功能多样性,同时也能吸引更多开发者和内容创作者参与,形成良性循环。

4. 行业标准形成

随着AI浏览器的普及,可能会形成新的行业标准和最佳实践。这些标准将涵盖AI伦理、数据隐私、用户体验等多个方面,引导行业健康有序发展。

结论

OpenAI Atlas浏览器的推出标志着AI技术与互联网体验融合的新阶段。通过将ChatGPT深度整合到浏览器中,Atlas不仅为用户提供了全新的交互方式,也为整个浏览器行业带来了创新动力。尽管面临激烈的市场竞争,Atlas凭借其独特的技术理念和用户体验,有望在AI驱动的互联网新时代占据重要位置。随着技术的不断进步和用户需求的演变,我们有理由相信,Atlas及其同类产品将继续推动互联网向更智能、更人性化的方向发展。