在人工智能技术快速发展的今天,AI代理的能力不断提升,但上下文窗口的限制一直是制约其处理复杂任务的关键瓶颈。Claude Developer Platform最新推出的上下文管理功能,特别是上下文编辑和记忆工具,为这一难题提供了创新解决方案。这些功能基于Claude Sonnet 4.5模型,使开发者能够构建性能更高、运行时间更长的AI代理,有效突破传统上下文限制的束缚。
上下文窗口的限制一直是AI代理面临的重大挑战。随着生产环境中的代理处理越来越复杂的任务并生成更多工具结果,它们往往会耗尽有效的上下文窗口,使开发者陷入两难境地:要么削减代理的对话记录,要么降低性能。上下文管理通过两种方式解决了这一问题,帮助开发者确保只有相关数据保留在上下文中,而有价值的见解能够在不同会话之间得到保存。
上下文编辑功能在接近token限制时,会自动从上下文窗口中清除过时的工具调用和结果。当代理执行任务并积累工具结果时,上下文编辑会移除过时内容,同时保持对话流程的连贯性,有效延长了代理无需人工干预即可运行的时间。这也提高了模型的整体性能,因为Claude只专注于相关的上下文信息。
记忆工具则使Claude能够通过基于文件的系统在上下文窗口之外存储和查阅信息。Claude可以在存储在您基础设施中的专用记忆目录中创建、读取、更新和删除文件,这些文件可以在不同对话中持久存在。这使得代理能够随着时间的推移建立知识库,在不同会话之间维护项目状态,并参考之前的学习内容,而不必将所有内容都保存在上下文中。
记忆工具完全通过工具调用在客户端运行。开发者管理存储后端,使他们能够完全控制数据的存储位置和持久化方式。Claude Sonnet 4.5通过内置的上下文意识增强了这两种能力——在整个对话过程中跟踪可用token,从而更有效地管理上下文。
这些更新共同创建了一个改进代理性能的系统:通过自动从上下文中移除过时的工具结果来支持更长的对话;通过将关键信息保存到记忆中来提高准确性,并将这些学习成果带到连续的代理会话中。
Claude Sonnet 4.5是构建代理的全球最佳模型。这些功能为长期运行的代理解锁了新的可能性——处理整个代码库、分析数百份文档,或维护广泛的工具交互历史。上下文管理建立在这一基础之上,确保代理能够有效利用这种扩展的能力,同时处理超出任何固定限制的工作流程。
在编程领域,上下文编辑可以清除旧的文件读取和测试结果,而记忆则保存调试见解和架构决策,使代理能够处理大型代码库而不会丢失进度。在研究领域,记忆存储关键发现,而上下文编辑移除旧的搜索结果,建立随时间推移提高性能的知识库。在数据处理方面,代理可以在内存中存储中间结果,而上下文编辑清除原始数据,处理原本会超过token限制的工作流程。
在代理搜索的内部评估集上,我们测试了上下文管理如何提高代理在复杂、多步骤任务上的性能。结果显示了显著的收益:将记忆工具与上下文编辑相结合,比基线提高了39%的性能。仅上下文编辑就带来了29%的改进。
在100轮网络搜索评估中,上下文编辑使代理能够完成因上下文耗尽而失败的工作流程,同时将token消耗减少了84%。这些数据清楚地表明,上下文管理不仅解决了技术限制,还显著提高了AI代理的整体性能和效率。
这些功能今天已在Claude Developer Platform上作为公共测试版提供,包括原生版本以及Amazon Bedrock和Google Cloud的Vertex AI中的版本。开发者可以探索上下文编辑和记忆工具的文档,或访问我们的cookbook以了解更多信息。
随着人工智能技术的不断发展,上下文管理功能的推出标志着AI代理能力的重要突破。通过有效解决上下文窗口限制这一长期挑战,Claude Sonnet 4.5为开发者提供了构建更强大、更高效的AI代理的工具。这不仅提升了当前AI应用的能力边界,也为未来更复杂、更智能的人工智能系统奠定了基础。









