在2025年OpenAI开发者大会的主题演讲中,CEO萨姆·奥特曼(Sam Altman)宣布了一项可能彻底改变用户与数字应用交互方式的创新:公司正在推出一个SDK预览版,允许开发者"在ChatGPT内部构建真实应用"。这一宣布标志着OpenAI正致力于将ChatGPT从一个简单的AI对话助手转变为一个通用的应用前端平台,重新定义用户与数字世界的交互方式。
应用内嵌:重新定义应用边界
OpenAI的新SDK将赋予开发者"全栈"控制能力,包括应用数据、操作触发器,甚至可以出现在现有ChatGPT对话窗口中的交互式用户界面。这意味着用户可以在不离开ChatGPT环境的情况下,直接使用各种第三方应用完成复杂任务。
在实时的舞台演示中,OpenAI软件工程师Alexi Christakis展示了新API如何"将应用上下文暴露回ChatGPT",他将其比作ChatGPT"与应用对话"的过程。例如,大型语言模型(LLM)可以实时扩展嵌入的Coursera视频中正在讨论的内容。Christakis在舞台上表示:"我不需要解释我在视频中看到的内容,ChatGPT能立即看到它。"
技术基础:模型上下文协议(MCP)
这一创新的技术基础是OpenAI构建在开源模型上下文协议(MCP)之上的SDK。奥特曼表示,这意味着已经使用MCP的开发者只需添加一个HTML资源即可启用ChatGPT集成。
模型上下文协议为AI应用之间的通信提供了标准化框架,使得不同应用能够无缝共享上下文和数据。这一开放标准的采用不仅降低了开发门槛,还促进了更广泛的生态系统发展,使更多开发者能够参与到这一创新应用模式中。
实际应用场景:无缝的多应用协同
新集成的应用为用户带来了前所未有的便捷体验。例如,ChatGPT用户可以直接要求Figma将草图转换为图表,并将结果直接集成到他们的ChatGPT对话中。同样,当用户寻求歌曲建议时,ChatGPT可以推荐并创建一个Spotify播放列表。
在演示中,还展示了ChatGPT同时使用Canva在后台生成海报创意,而用户则咨询内嵌的Zillow地图获取信息。即使将Zillow窗口扩展到全屏,用户仍可以通过覆盖的聊天窗口向ChatGPT请求额外上下文。
商业模式与未来发展
奥特曼提到了一个"智能商务协议",将允许应用用户在ChatGPT内享受"即时结账"功能,但他后来澄清说,关于货币化的细节"很快"才会公布。
除了已经提到的应用外,Expedia和Booking.com等应用今天起将在ChatGPT中可用。Peloton、Target、Uber和Doordash等其他合作伙伴的应用将在"未来几周"内集成到ChatGPT中。
OpenAI还宣布,其他开发者今天就可以开始使用SDK进行构建,然后向OpenAI提交申请,以便"今年晚些时候"在ChatGPT内进行审核和发布。奥特曼表示,符合特定"开发者指南"的应用将列入综合目录,而那些在设计 and 功能方面达到更高标准的应用将获得更突出的展示位置。
AgentKit:简化AI代理创建
在主题演讲的其他部分,奥特曼宣布了AgentKit,这是一个新工具,旨在让OpenAI用户使用简化的构建块图形用户界面(GUI)创建专门的交互式聊天机器人。新软件包括集成在ChatKit界面内的性能测量和测试工作流程工具。
在实时演示中,OpenAI平台体验专家Christina Huang给自己设定了八分钟的期限,使用Agent为Dev Day网站创建一个实时、定制化的问答"Ask Froge"聊天机器人。虽然演示在规定时间内完成,但Huang确实使用了大量预构建的"小部件"和包含关于活动预填充信息文档来简化聊天机器人的创建过程。
API更新与模型扩展
主题演讲还宣布了OpenAI的codex编码代理的次要更新,包括与Slack的集成以及一个新的SDK,以便更轻松地集成到现有的编码工作流程中。奥特曼还宣布了一些最新模型将通过API提供给用户,包括Sora 2、GPT5-Pro以及公司实时音频界面的一个更小、更便宜的新版本。
行业影响与未来展望
OpenAI的这一举措可能会对整个科技行业产生深远影响。将ChatGPT转变为通用应用前端,不仅改变了AI助手的使用方式,更重新定义了应用程序的边界和交互模式。
传统上,用户需要在不同的应用之间切换来完成各种任务,而这一创新使得用户可以在一个统一的界面中访问和操作多个应用。这种"应用内应用"的模式可能会成为未来数字交互的主流方式,推动更无缝的用户体验和更高的工作效率。
对于开发者而言,这一开放平台提供了将应用直接集成到ChatGPT用户基础中的机会,无需用户单独下载或访问他们的应用。这可能会催生一系列创新应用,专门设计用于在ChatGPT环境中运行,并利用其AI能力提供更智能的交互体验。
挑战与考量
尽管这一创新前景广阔,但也面临一些挑战和考量。首先是隐私和数据安全问题,当多个应用在同一个环境中运行时,如何确保用户数据的安全和隐私将成为关键问题。
其次是用户体验的一致性问题。不同应用有不同的界面和交互模式,如何在统一的ChatGPT环境中保持一致且直观的用户体验,需要精心设计。
最后是商业模式的可持续性。OpenAI如何确保这一平台对所有参与者都有利可图,包括开发者、应用提供商和OpenAI本身,将是决定这一创新能否长期成功的关键因素。
结语:AI助手的新纪元
OpenAI将ChatGPT转变为通用应用前端的举措,标志着AI助手从简单的对话工具向全能数字工作空间的进化。这不仅为用户带来了前所未有的便利,也为开发者提供了创新的应用交付渠道。
随着更多应用的集成和功能的完善,ChatGPT可能会成为用户日常数字生活的中心枢纽,重新定义我们与技术和应用交互的方式。这一创新不仅展示了AI技术的巨大潜力,也预示了人机交互的未来发展方向——更加无缝、智能和一体化。
OpenAI的Alexi Christakis展示在ChatGPT对话窗口中生成的Figma海报。
将在未来几周内集成到ChatGPT的第三方应用完整列表。