在2008年,谷歌推出Chrome浏览器以帮助将其行业领先的搜索引擎更好地整合到网页浏览体验中。如今,OpenAI宣布了Atlas浏览器,希望它能为ChatGPT大语言模型做类似的事情,回答'如果我能与浏览器对话会怎样?'这个问题,正如OpenAI团队所言。
OpenAI创始人兼CEO萨姆·奥特曼(Sam Altman)在直播宣布中表示,Atlas将让用户'与页面对话',帮助ChatGPT成为用户与在线'大量工作和生活发生的地方'互动的核心方式。他说:'我们希望人们未来使用互联网的方式...是聊天体验和网页浏览可以成为很好的类比。'
这款新浏览器现已可在macOS上下载,奥特曼承诺Windows和移动版本将'尽快'推出。
随你而行的语言模型
新的Atlas标签页主页模仿了Chrome搜索框的简洁性,提供一个文本字段,提示用户'询问ChatGPT或输入网址'。用户可以使用类似于ChatGPT.com的界面访问聊天历史或不同的ChatGPT模型。Atlas浏览器还将在搜索框下方填充建议,范围从新闻报道链接到浏览器可以为您执行的任务建议。
在直播中,OpenAI团队表示,Atlas具备网络用户期望浏览器拥有的功能:标签页、书签和自动填充等。但现在与ChatGPT的集成意味着'聊天体验在浏览过程中无处不在'。
这意味着您可以使用ChatGPT通过人类可解析的语言提示来搜索书签或浏览历史。这也意味着您可以在当前页面旁边打开一个'侧边聊天',并提出依赖于该特定页面上下文的问题。如果您想使用ChatGPT编辑Gmail草稿,现在可以直接在草稿窗口中完成,无需在ChatGPT窗口和编辑器之间复制粘贴。

Atlas的默认搜索体验,包含更传统结果的标签页。

Atlas的默认'新标签页'体验,包含一些建议。
输入简短的搜索提示时,Atlas默认会以语言模型(LLM)形式回复,提供书面答案并在适当的地方嵌入来源链接(类似于OpenAI现有的搜索功能)。但浏览器也会提供包含更传统链接列表、图像、视频或新闻的标签页,就像您从没有LLM功能的搜索引擎获得的那样。
让我们为您浏览
在直播演示的结尾,OpenAI团队展示了Atlas的'代理模式'(Agent Mode)。虽然这个'预览模式'功能仅对ChatGPT Plus和Pro订阅用户开放,但研究主管威尔·埃尔斯沃斯(Will Ellsworth)表示,他希望最终它能够帮助用户实现'一个用于生活氛围的惊人工具',就像LLM编码工具已成为'氛围编码'的工具一样。
为此,团队展示了浏览器将在Google Docs表格中编写的规划任务在几分钟内转移到任务管理软件Linear的过程。代理模式还被展示从食谱网页获取食材清单,并在另一个标签页中直接添加到用户的Instacart购物车中(尽管演示代理在结账前停止以获得用户批准)。

Atlas的代理模式接管,将规划任务从一个基于网络的应用转移到另一个。

Atlas的代理模式将食谱中的商品添加到用户的Instacart购物车。
Atlas用户可以观看代理模式在各种标签页和网页间点击,随时接管操作,或者让它在后台运行而无需监督。用户可以使用下拉菜单直接激活代理模式,但当用户提示表明ChatGPT可能能够帮助完成任务时,它也可以建议开启。
OpenAI团队表示,代理模式可以像人类用户一样点击浏览,完全访问该用户的身份验证和浏览历史。但OpenAI表示,代理模式只能在网页标签页内运行,无法在浏览器外执行代码。您还可以手动控制新的Atlas标签页是否已'登录'或'退出'各种其他网络服务,并使用无痕窗口进行不希望LLM记住的浏览。
竞争激烈的市场
浏览器领域的现有竞争对手一直在尝试将类似的AI功能整合到其产品中:微软在Edge浏览器中内置了Copilot版本,谷歌则基于Chrome推出了Gemini功能,承诺将在未来几个月内包括'代理功能'。许多初创公司也专注于从头开始构建AI驱动的浏览器,最引人注目的是Perplexity,尽管其总市值仅为1400万美元,却最近大胆出价345亿美元收购Chrome。
值得注意的是,OpenAI曾在今年4月公开表达了对收购Chrome的兴趣,尽管该反垄断案件最近的法律更新意味着谷歌现在似乎不太可能在近期出售。
《The Information》去年报道了OpenAI的浏览器计划,路透社在7月也援引匿名消息来源提供了更多信息。路透社指出,浏览器将使OpenAI能够获得比输入ChatGPT提示窗口更直接的有价值用户数据访问,并可能为将广告整合到ChatGPT体验提供简单方式。但当然,这一切都取决于ChatGPT超过7亿的每周活跃用户中有多少人愿意放弃当前浏览器,转而采用来自主要LLM品牌的经验较少的竞争对手。
Atlas浏览器的技术创新与市场前景
Atlas浏览器的推出标志着OpenAI在AI应用领域的一次重要扩张。与传统浏览器不同,Atlas的核心优势在于其深度集成的ChatGPT能力,这不仅改变了用户获取信息的方式,更重塑了人与互联网的交互模式。
从技术角度看,Atlas浏览器实现了几个关键创新:首先是'上下文感知'功能,能够理解当前页面的内容并提供相关建议;其次是'无缝集成',将ChatGPT能力直接嵌入到网页浏览的各个环节;最后是'代理自动化',通过Agent模式实现跨网页任务的自动执行。
这些技术创新背后是OpenAI在自然语言处理和机器学习领域的深厚积累。ChatGPT能够理解复杂的用户指令,提取网页中的关键信息,并根据用户需求执行相应操作,这需要强大的语义理解和决策能力。
在市场竞争方面,Atlas浏览器面临来自多方面的挑战。微软Edge和谷歌Chrome等传统浏览器巨头已经在积极整合AI功能,而Perplexity等专注于AI的初创公司也在不断推出创新产品。然而,OpenAI凭借其在ChatGPT领域的技术优势和品牌影响力,有望在AI浏览器这一新兴市场中占据重要位置。
用户隐私与安全考量
随着AI浏览器功能的不断增强,用户隐私和安全问题也日益凸显。OpenAI在这方面采取了多项措施:首先,用户可以手动控制Atlas标签页的登录状态,选择是否将特定网页服务与ChatGPT关联;其次,提供了无痕浏览模式,确保敏感信息不被LLM记录;最后,明确限制了Agent模式的操作范围,仅能在网页标签页内运行,无法执行浏览器外的代码。
这些措施在一定程度上缓解了用户对AI浏览器隐私泄露的担忧。然而,随着Atlas功能的不断扩展,特别是Agent模式能够访问用户的完整浏览历史和身份验证信息,如何平衡功能便利性与隐私保护仍将是OpenAI需要持续关注的问题。
未来发展方向
Atlas浏览器的推出只是OpenAI在AI应用领域探索的开始。从长远来看,Atlas有多个可能的发展方向:一是扩展至更多平台,完善移动端体验;二是增强Agent模式的自动化能力,使其能够处理更复杂的跨网页任务;三是深化与第三方应用的集成,构建更广泛的AI应用生态系统。
此外,随着技术的不断进步,Atlas浏览器可能会进一步模糊AI助手与网页浏览器之间的界限,最终演变为一种全新的互联网交互方式。正如奥特曼所言,未来人们使用互联网的方式可能会以'聊天体验和网页浏览的结合'为主要特征,而Atlas正是这一趋势的先行者。
结语
OpenAI推出Atlas浏览器标志着AI技术在互联网应用领域的一次重要突破。通过将ChatGPT的强大能力深度整合到网页浏览体验中,Atlas不仅改变了用户获取和交互信息的方式,也为AI在日常工作生活中的应用开辟了新的可能性。尽管面临激烈的市场竞争和用户隐私等多重挑战,但凭借技术创新和先发优势,Atlas有望成为AI浏览器领域的标杆产品,引领互联网交互方式的新变革。









