ChatGPT Agent:AI 助手的新纪元,自动化任务与潜在的安全隐患

1

在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到我们生活的方方面面。OpenAI 最新推出的 ChatGPT Agent,无疑是这场技术革命中的一颗耀眼明星。这项创新功能巧妙地融合了网页浏览与任务执行能力,使得 AI 助手能够自主完成多步骤任务,极大地拓展了人机协作的边界。

Two tin toy robots looking at laptop screen.

ChatGPT Agent 的核心在于其“自主性”。它不再仅仅是被动地接收指令,而是能够像一位高效的助理一样,主动规划、执行任务。用户只需提出一个需求,Agent 就能自主地浏览网页、运行代码,甚至创建文档,而这一切都在用户的掌控之下进行。

Agentic AI 的崛起

OpenAI 的这一举措,标志着“Agentic AI”时代的加速到来。所谓 Agentic AI,指的是那些能够代表用户自主执行多步骤操作的系统。ChatGPT Agent 的出现,让人们看到了 AI 在自动化领域的巨大潜力。无论是为特定场合挑选服装,还是制作 PowerPoint 演示文稿,甚至是规划膳食或更新财务报表,Agent 都能胜任。

实现这些功能,离不开一系列技术的协同作用。ChatGPT Agent 巧妙地结合了网页浏览器、终端访问和 API 连接,并通过“ChatGPT 连接器”与 Gmail、GitHub 等应用实现无缝集成。这种整合能力,使得 Agent 能够在一个统一的平台上完成各种复杂的任务。

在使用 Agent 的过程中,用户可以通过 ChatGPT 界面中的一个窗口,实时监控 AI 的所有操作。这个窗口展示的是 AI 在其私有沙箱中执行任务的过程。这个沙箱拥有独立的虚拟操作系统和网络浏览器,能够访问真实的互联网,但不会干扰用户的个人设备。OpenAI 强调,ChatGPT 使用的是其自身的虚拟计算机来完成任务,从而确保用户数据的安全。

A still image from an OpenAI ChatGPT Agent promotional demo video showing the AI agent searching for flights.

权限与安全:用户至上

与 OpenAI 之前的 Operator 工具类似,Agent 在执行具有实际后果的操作(如购物)之前,需要获得用户的明确许可。用户可以随时中断任务、接管浏览器或完全停止操作。此外,系统还提供“观察模式”,用于那些需要用户密切监督的任务,例如发送电子邮件。

由于 Agent 在能力上超越了 Operator,OpenAI 计划在几周后关闭 Operator 预览站点。这一举措表明,OpenAI 正将重心转向功能更强大、更全面的 Agent 平台。

性能评估:理想与现实的距离

OpenAI 对 ChatGPT Agent 的性能充满信心,但实际表现如何,还需要经过市场的检验。AI 模型并非全能的问题解决者,而更像是一位精通模仿的专家。它在组合各种场景方面具有一定的灵活性,但也存在许多盲点。Agent 的训练数据主要来自计算机和工具的使用案例,因此,对于那些超出训练范围的任务,Agent 可能会感到力不从心。

根据 ChatGPT Agent 系统卡显示,Agent 在执行需要以新颖方式链接多个步骤的复杂任务时,可能会失败。例如,在“网络靶场”评估中,Agent 被要求在模拟的在线零售商网络中执行全面操作。尽管 Agent 能够成功地执行初始研究步骤,例如识别网络上的服务器,但它很难继续前进,无法将必要的漏洞利用链接起来以实现最终目标。即使在获得提示的情况下,Agent 仍然失败了(在这种情况下,这可能是一件好事,因为它无法执行自动黑客攻击),这表明其解决超出其熟悉训练示例的复杂问题的能力存在明显的局限性。

![OpenAI writes, "The SpreadsheetBench authors used a Windows environment using Microsoft Excel to evaluate spreadsheets. We used an OSX environment and LibreOffice, which may result in small grading differences. For example, the authors found an Overall Hard restriction of 15.02% for GPT‑4o, and we obtained 13.38%. We used the complete 912-question benchmark." Credit: OpenAi] (https://image.shopcn.life/midPaint/1753157713753.png)

即便如此,OpenAI 报告称,ChatGPT agent 在其自身的基准测试中实现了最先进的性能,在未经公正的第三方验证之前,始终应该对此持保留态度。在 Humanity's Last Exam中(该基准测试旨在测试 AI 在专家级问题上的表现),该模型获得了 41.6% 的准确率(相比之下,OpenAI o3在使用工具的情况下获得了 24.9%)。在 FrontierMath(迄今为止最困难的数学基准测试之一)中,它在工具访问的情况下达到了 27.4% 的准确率(o3 使用 Python 的得分为 19.3%)。

OpenAI 还声称,该系统在某些数据科学任务(如数据分析和建模,包括创建预测或预测模型)方面的表现优于人类。在 DSBench(一种旨在衡量这种能力的基准测试)中,ChatGPT agent 在数据分析任务中获得了 89.9% 的分数,而人类为 64.1%,在数据建模任务中获得了 85.5% 的分数,而人类为 65.0%。该 agent 在 OpenAI 的 BrowseComp 中获得了 68.9% 的分数,用于查找难以定位的网络信息,在 SpreadsheetBench 中获得了 45.5% 的分数,用于编辑电子表格,这高于 OpenAI 的其他 AI 模型。

值得注意的是,即使 OpenAI 表示 Agent 可以为用户制作 PowerPoint 幻灯片,该公司也承认幻灯片生成仍处于 beta 阶段,并且输出在格式和润色方面可能感觉“简陋”。

安全与隐私:不容忽视的挑战

OpenAI 坦承,ChatGPT Agent 的推出带来了一系列新的安全问题。由于 Agent 能够直接在网站上执行操作,并通过连接的服务访问用户数据,因此它很容易受到提示注入攻击,即黑客试图通过误导 AI 模型的指令来操纵 AI 的行为(在这种情况下,可能是通过网页上的隐藏指令)。例如,某个网站可能包含一个隐藏的表单字段,指示 AI 模型在您不知情的情况下输入您的信用卡信息。

OpenAI 表示,它已经实施了安全措施来防范提示注入,包括训练模型来识别和“抵抗”这些攻击,同时要求用户确认具有重要意义或看起来可疑的操作。该模型还经过训练,可以主动拒绝高风险任务,例如银行转账。在周四的直播中,一位 OpenAI 工程师将 Agent 描述为一个协同工作的 AI 模型系统,其中一些模型不断监控其他模型的行为,以发现可疑活动。如果这些监督者发现潜在的危险情况,他们可以假设性地停止该过程。

至于隐私方面,由于 Agent 在 OpenAI 服务器上的虚拟机中运行,因此用户无需担心该机器人访问存储在其设备上的本地私有数据。但是,您输入 ChatGPT Agent 的内容仍可能在其操作期间在网络上共享。除此之外,OpenAI 表示,新 agent 的隐私控制允许用户一键删除所有浏览数据并注销活动会话。当用户在“接管模式”下控制浏览器时,OpenAI 表示它不会收集或存储在此会话期间输入的数据,包括密码。

Agent 今天面向 ChatGPT Pro 用户推出,他们每月可以收到 400 条消息。Plus 和 Team 订阅者将在未来几天内获得访问权限,每月可以收到 40 条消息。企业和教育用户将在未来几周内获得访问权限。该功能目前在欧洲经济区和瑞士尚不可用。

我们尚未亲自使用过 ChatGPT Agent,但我们可能会在稍后的日期跟进我们的经验。