OpenAI再出重拳,助力智能体开发
2025年3月11日,OpenAI宣布推出一系列全新工具和API,旨在帮助开发者和企业更轻松地构建、部署和扩展高效可靠的AI智能体(Agent)。这一举措标志着OpenAI在推动AI技术发展和应用方面又迈出了重要一步。
此次发布的核心内容包括两大部分:
- Responses API: 一种全新的API原语,旨在简化AI智能体的开发流程。
- Agents SDK: 一个开源的开发工具包,用于协调多智能体工作流。
这两大工具的推出,将为开发者提供更强大、更灵活、更易用的开发平台,进一步降低AI智能体开发的门槛,加速AI技术的应用和普及。
一、 Responses API:Chat Completions的进化,智能体的基石
Responses API是OpenAI此次发布的重头戏。它被定位为Chat Completions API的“超集”,并融合了Assistants API的工具调用能力。Responses API旨在为开发者提供一个更灵活的基础,以构建更强大的AI智能体。
1. Responses API的核心优势
Responses API具有以下核心优势:
- 简洁性与强大功能的结合: Responses API继承了Chat Completions API的简洁性,同时又具备了Assistants API的工具调用能力。这使得开发者能够以更少的代码实现更复杂的功能。
- 内置工具集成: Responses API内置了多种实用工具,包括网络搜索、文件搜索和计算机操作。这些工具可以直接通过API调用,无需开发者自行集成。
- 统一的接口: 通过Responses API,开发者可以使用统一的接口调用多个工具和模型轮次,从而简化开发流程,提高开发效率。
- 可用性改进: Responses API采用了统一的基于事项(item)的设计、更简单的多态性、直观的流式事件和SDK助手,进一步提升了开发者的使用体验。
- 数据存储: Responses API使得在OpenAI上存储数据更加容易,方便开发者使用跟踪和评估等功能来评估智能体性能。
2. Responses API的内置工具
Responses API内置了三大实用工具,为开发者提供了强大的支持:
(1) 网络搜索
- 功能: 允许AI智能体从互联网中获取最新信息,并提供清晰的引用来源。
- 优势: 快速、准确、可靠,并提供可追溯的信息来源。
- 应用场景: 购物助手、研究代理、新闻摘要、问答系统等。
- 技术细节: 使用与ChatGPT搜索相同的模型,并在SimpleQA基准测试上取得了优异的成绩。
- 定价: GPT‑4o search 和 4o-mini search 的定价分别为每千次查询 30 美元和 25 美元。
(2) 文件搜索
- 功能: 允许AI智能体从大量文档中快速检索相关信息。
- 优势: 支持多种文件类型、查询优化、元数据过滤和自定义重新排名,提供快速、准确的搜索结果。
- 应用场景: 客户支持、法律咨询、技术文档查询、企业知识库等。
- 技术细节: 集成了多种先进的搜索技术,确保搜索结果的准确性和相关性。
- 定价: 每千次查询 2.50 美元,文件存储价格为 0.10 美元/GB /天,首 GB 免费。
(3) 计算机操作
- 功能: 允许AI智能体模拟鼠标和键盘操作,自动化浏览器或操作系统中的任务。
- 优势: 能够自动化重复性任务,提高工作效率,减少人为错误。
- 应用场景: 数据录入、质量检查、Web应用测试、跨系统数据迁移等。
- 技术细节: 使用了Computer-Using Agent(CUA)模型,并在OSWorld、WebArena和WebVoyager等基准测试上取得了SOTA成绩。
- **定价:**3 美元/100 万输入 token 和 12 美元/100 万输出 token。
- 安全措施: OpenAI为该工具添加了多项安全缓解措施,包括防止提示词注入的安全检查、敏感任务的确认提示、帮助开发者隔离环境的工具以及增强对潜在政策违规行为的检测。
3. Responses API与现有API的关系
Responses API的推出,并不意味着OpenAI将放弃现有的Chat Completions API和Assistants API。相反,OpenAI对这三个API进行了明确的定位和规划:
- Chat Completions API: 仍然是OpenAI最广泛采用的API,OpenAI将继续支持它,并发布支持它的新模型。对于无需内置工具的开发者,可以继续使用Chat Completions API。
- Responses API: 是Chat Completions API的超集,具有同样出色的性能,并提供了更强大的功能。对于新的集成,OpenAI建议从Responses API开始。
- Assistants API: OpenAI计划在实现Assistants和Responses API之间的完全功能对等后,正式宣布弃用Assistants API,目标截止日期为2026年中期。
二、 Agents SDK:多智能体协作的利器,构建复杂AI系统
为了支持更复杂的AI应用场景,OpenAI还推出了Agents SDK,这是一个开源的开发工具包,专门用于协调多智能体工作流。
1. Agents SDK的核心功能
Agents SDK提供了以下核心功能:
- 智能体配置: 开发者可以轻松配置多个AI智能体,并为每个智能体分配特定任务。
- 任务交接: 支持智能任务转移,确保多个智能体之间的协作无缝衔接。
- 安全机制: 内置输入输出验证功能,防止智能体执行不符合预期的操作。
- 执行追踪: 提供可视化工具,帮助开发者调试和优化智能体性能。
2. Agents SDK的优势
Agents SDK的优势在于:
- 标准化框架: 为多智能体系统的开发提供了标准化框架,降低了开发难度,提高了开发效率。
- 灵活性: 支持与Responses API和Chat Completions API配合使用,也可与其他提供商的模型配合使用。
- 开源: 开发者可以根据自己的需求对Agents SDK进行定制和扩展。
3. Agents SDK的应用场景
Agents SDK适用于各种需要多智能体协作的复杂场景,包括:
- 客户支持自动化: 通过多个智能体协同工作,提供更高效、更智能的客户服务。
- 多步骤研究: 将复杂的研究任务分解为多个子任务,由不同的智能体分别完成。
- 内容生成: 通过多个智能体协作,生成更丰富、更多样化的内容。
- 代码审查: 利用多个智能体对代码进行多角度审查,提高代码质量。
- 销售潜在客户挖掘: 通过多个智能体协同工作,更高效地挖掘潜在客户。
三、 OpenAI的愿景:智能体将成为未来工作场景的核心
OpenAI认为,AI智能体将成为未来工作场景中不可或缺的一部分,显著提升各行业的生产力。随着模型能力的不断增强,OpenAI将继续投资于API集成和新工具开发,帮助开发者更高效地构建、评估和优化AI智能体。
四、 Responses API背后的设计哲学
Responses API的设计者之一、OpenAI的Atty Eleti分享了Responses API背后的设计理念和故事。他表示,Responses API是他设计OpenAI API两年经验的累积成果。
Responses API的设计哲学是“交付能力,而非抽象(Ship capabilities, not abstractions.)”。
OpenAI引领智能体开发新时代
OpenAI此次发布的Responses API和Agents SDK,为开发者构建、部署和扩展高效可靠的AI智能体提供了强大的支持。这两大工具的推出,将进一步降低AI智能体开发的门槛,加速AI技术的应用和普及。
随着AI技术的不断发展,智能体将在越来越多的领域发挥重要作用,为我们的生活和工作带来更多便利和效率。OpenAI作为AI领域的领军企业,将继续引领智能体开发的新时代。