AI前沿动态：ChatGPT记忆开放、华为手表双模型、多模态AI新突破

在科技日新月异的今天，人工智能（AI）正以前所未有的速度渗透到我们生活的方方面面。从OpenAI的ChatGPT到华为的智能手表，AI技术的每一次进步都引发了业界的广泛关注。本文将深入剖析近期AI领域的几大热点事件，带您洞悉技术趋势，了解创新AI产品应用。

OpenAI 免费开放 ChatGPT 记忆功能：个性化对话体验的新篇章

OpenAI 近期宣布，将记忆功能免费向所有 ChatGPT 用户开放，这无疑是AI领域的一项重大进展。这一举措意味着，即使是免费用户，也能体验到 ChatGPT 在对话连续性上的提升。ChatGPT 能够记住用户之前的对话内容，并在后续的交流中加以应用，从而实现更加个性化和连贯的对话体验。

对于付费用户而言，这一功能的提升更为显著。他们可以引用更久远的对话记录，享受更高便捷性和深度互动。用户还可以随时管理记忆设置，关闭或删除特定记忆内容，充分保护个人隐私。这一功能的开放，无疑将进一步提升 ChatGPT 的用户粘性和市场竞争力。

aibase

蚂蚁集团推出 “AI 健康管家”：智能健康服务惠及千万用户

蚂蚁集团的 “AI 健康管家” 近期通过了信通院医疗健康行业大模型可信评估，成为首批通过评估的产品之一。这标志着蚂蚁集团在医疗AI领域的持续探索和领先地位。据了解，“AI 健康管家” 已经服务超过 4000 万用户，并有 60 多位知名医生 AI 智能体入驻，提供预约医生、健康评估、医疗报告解读等个性化服务。

“AI 健康管家” 的推出，不仅提升了医疗服务的效率和便捷性，也为用户提供了更加个性化和智能化的健康管理方案。通过可信评估，也确保了其安全性和有效性，为用户提供可靠的健康保障。

Anthropic 开设免费课程：掌握 MCP 构建 AI 应用程序

Anthropic 与 DeepLearning.AI 合作推出免费课程 ‘MCP: 使用模型上下文协议构建富上下文 AI 应用’，旨在帮助开发者掌握 MCP 协议，简化 AI 应用与外部工具和数据的连接。MCP 是一种通用协议，通过标准化 LLM 与外部数据源的交互方式，提升上下文处理能力。该课程涵盖 MCP 核心概念、架构及实践项目，帮助开发者快速上手并构建智能 AI 应用。MCP 开源且支持多种工具和数据源集成，有望推动 AI 开发标准化与跨领域融合。

微信截图_20250604085714.png

谷歌 DeepMind 推出新技术：无需 3D 模型也能生成真实运动视频

谷歌 DeepMind 团队与布朗大学合作开发了 ‘力提示’ 技术，无需 3D 模型和物理引擎即可生成逼真的运动效果。用户通过指定力的方向和强度就能操控 AI 生成的视频内容。这项技术极大地简化了运动视频的生成过程，降低了对专业技能和硬件设备的需求。

该模型具备强大的泛化能力，能够适应新场景和物体，甚至掌握部分物理规则。这意味着，用户可以通过简单的文本指令，创造出各种各样生动逼真的运动视频。

Exa 联手 OpenRouter：400+AI 模型解锁网络搜索，引爆 RAG 革命

Exa 与 OpenRouter 合作，为超过 400 种大语言模型提供实时网络搜索功能，通过 RAG 技术增强模型的信息获取能力，革新 AI 交互体验。这意味着，这些 AI 模型能够动态获取最新的网络信息，突破传统知识更新的局限。

开发者可以通过 OpenRouter 灵活调用，降低开发成本，拓展 AI 应用场景。这一合作将极大地提升 AI 模型的实用性和智能化水平。

中国知网推出 CNKI AI：打造智能学术研究助手

中国知网推出了基于人工智能技术的全新探索成果 —— CNKI AI。该平台通过 AI 学术研究助手与增强检索的整合，提供更加精准、全面的知识服务。CNKI AI 提供问答式增强检索和生成式知识服务，助力学术研究和科技创新。高质数据与可信可控特性确保服务高效、精准且可靠。双路检索与段落检索提升查全查准率，满足多样化需求。

Anthropic 推出 Claude Explains 博客项目：探索 AI 与人类专家协作新模式

Anthropic 推出了名为 'Claude Explains' 的博客项目，展示其 AI 模型 Claude 在内容创作中的能力。博客内容由 Claude AI 生成并经人类专家编辑，首批文章聚焦技术主题，未来计划扩展至更多领域。这一项目旨在探索 AI 与人类专家在内容创作领域的协作模式，充分发挥 AI 的生成能力和人类专家的专业知识。

Claude Pro 升级：研究模式与远程 MCP 整合全面开放

Anthropic 宣布 Claude Pro 新增研究模式和远程 MCP 整合功能，旨在提升 AI 助手的实用性和生产力。研究模式可以将复杂研究任务从小时级压缩到分钟级，大幅提升效率。远程 MCP 整合功能使 Claude Pro 用户能无缝连接多种工具，简化跨平台协作。升级后的 Claude Pro 在功能和价格上更具竞争力，有望吸引更多用户。

Fish Audio 推出 OpenAudio S1：200 万小时数据驱动的超自然语音模型

Fish Audio 近期推出了 OpenAudio S1，这款基于大量数据训练的文本转语音模型，不仅在语音自然度和情感表达方面表现突出，还提供了灵活的双版本选择，为企业和开发者提供了高效且经济的语音生成解决方案。OpenAudio S1 模型基于 200 万小时音频训练，支持多样语言风格与情感表达。同时，提供 S1（40 亿参数）和 S1-mini(5 亿参数) 两种版本，满足不同场景需求。通过使用 RLHF 技术，生成情感化语音，提升用户体验并降低成本。

OpenAI Codex 升级：语音输入和联网功能助力编程更智能

OpenAI 对其编程工具 Codex 进行了全面升级，新增了语音输入和联网能力，同时降低了使用门槛，提升了开发者的编程效率。新增联网功能后，Codex 可自动完成环境配置、代码检查和测试，开发者可以专注于逻辑和功能实现。语音输入功能让开发者能更自然地传达指令，提高工具易用性。Codex 现已向 ChatGPT Plus 用户开放，降低使用门槛，让更多开发者受益。

OpenAI 升级 AI 智能体开发工具：支持 TypeScript 、改进语音对话

OpenAI 对其 AI 智能体开发工具进行了重要升级，包括新增 TypeScript 支持、优化语音界面、增强可观测性以及改进语音对语音模型。Agents SDK 增加了对 TypeScript 的支持，使 JavaScript 和 Node.js 开发者也能参与智能体开发。RealtimeAgent 功能支持低延迟语音应用，可暂停执行并手动确认智能体状态，适合监管场景。通过优化语音对语音模型，降低延迟、提高对话自然性与中断处理能力。

华为 WATCH5 智能手表接入双大模型：运动健康体验全面升级

HUAWEI 发布 WATCH5 智能手表，通过接入盘古大模型和 DeepSeek 大模型，在语音交互、健康监测及生态互联方面实现突破性提升。WATCH5 支持双 AI 大模型，语音交互更便捷且健康数据分析更精准。腕上小艺功能可分析 20+ 运动与健康领域近 200 项指标，提供个性化指导。同时，支持生态互联，兼容华为设备及其他第三方健康管理平台，助力全面健康生活。

DeepSeek 可能使用了 Google Gemini 数据训练新 AI 模型

DeepSeek 最近发布的 R1 推理 AI 模型更新版在多项基准测试中表现出色，但其训练数据来源引发争议。有开发者指出其模型与 Google Gemini 系列有相似之处，且 DeepSeek 此前也被指控通过 “数据蒸馏” 技术训练模型。尽管如此，AI 界普遍认为这种现象可能源于模型间的相互模仿。

松下推出 “OmniFlow” 多模态生成 AI：实现文本、图像与音频的自由转换

松下控股公司联合 UCLA 研究人员开发了名为 “OmniFlow” 的多模态生成 AI，具备 “任意对任意” 生成能力，可实现文本、图像和音频间的自由转换，降低数据采集成本并提升生成效率。创新技术 ‘OmniFlow’ 支持文本、图像、音频自由转换，大幅提升多模态生成 AI 的应用潜力。数据需求低至传统方法的 1/60，显著降低数据采集成本，优化模型训练效率。在文本转图像和文本转音频任务中表现最优，展现最佳性能，未来有望应用于工厂与生活方式领域。

总结

从 ChatGPT 的记忆功能开放，到蚂蚁集团的 AI 健康管家，再到华为 WATCH5 智能手表的双大模型接入，AI 正在以惊人的速度渗透到我们生活的方方面面。这些技术不仅提升了效率、便捷性，也为我们带来了更加个性化、智能化的体验。随着 AI 技术的不断发展，我们有理由相信，未来的生活将更加美好。