AI前沿速递：ChatGPT记忆解锁，多模态AI破局，智能生活跃迁

在人工智能领域，每天都有新的突破和进展。本文将深入探讨近期AI领域的几项重要进展，从OpenAI的ChatGPT到华为的智能手表，逐一剖析其技术特点和应用前景。

ChatGPT免费开放记忆功能：个性化对话的新里程碑

OpenAI宣布向所有ChatGPT用户免费开放记忆功能，这是一个重要的里程碑。这意味着即使是免费用户也能体验到一定程度的个性化对话。记忆功能允许ChatGPT记住用户之前的对话内容，并在后续的互动中加以利用，从而使对话更加连贯和个性化。

对于付费用户，他们可以享受更高级的记忆功能，例如引用更久远的对话记录。用户还可以随时管理记忆设置，关闭或删除特定的记忆内容，从而保护自己的隐私。这一举措无疑将提升ChatGPT的用户体验，并推动其在更多场景中的应用。

aibase

蚂蚁集团“AI健康管家”：智能健康服务的新模式

蚂蚁集团推出的“AI健康管家”通过了信通院医疗健康行业大模型可信评估，成为首批通过评估的产品之一。这标志着AI在医疗健康领域的应用进入了一个新的阶段。AI健康管家通过整合医疗知识和AI技术，为用户提供个性化的健康管理服务。

目前，AI健康管家已经服务超过4000万用户，并有60多位知名医生AI智能体入驻。用户可以通过AI健康管家预约医生、进行健康评估、解读医疗报告等。这些服务不仅提高了医疗效率，也降低了医疗成本，使更多人能够享受到优质的健康服务。

Anthropic推出免费课程：构建富上下文AI应用的新途径

Anthropic与DeepLearning.AI合作推出免费课程“MCP: 使用模型上下文协议构建富上下文AI应用”，旨在帮助开发者掌握MCP协议，简化AI应用与外部工具和数据的连接。MCP是一种通用协议，通过标准化LLM与外部数据源的交互方式，提升上下文处理能力。

该课程涵盖MCP的核心概念、架构及实践项目，帮助开发者快速上手并构建智能AI应用。MCP是开源的，并支持多种工具和数据源集成，这将推动AI开发的标准化与跨领域融合。通过学习这门课程，开发者可以更好地利用AI技术，构建更智能、更强大的应用。

微信截图_20250604085714.png

谷歌DeepMind新技术：生成真实运动视频的新方法

DeepMind团队与布朗大学合作开发了“力提示”技术，无需3D模型和物理引擎即可生成逼真的运动效果。用户可以通过指定力的方向和强度来操控AI生成的视频内容。这项技术为视频生成领域带来了新的可能性。

传统的运动视频生成需要复杂的3D模型和物理引擎，而“力提示”技术则无需这些。它仅靠文本指令即可生成真实的运动视频。用户可以通过力的方向和强度来操作，实现自然流畅的运动表现，从而提升视频的真实感。这项技术具有强大的泛化能力，能够适应新的场景和物体，甚至掌握部分物理规则。

Exa联手OpenRouter：RAG技术赋能AI模型的新突破

Exa与OpenRouter合作，为超过400种大语言模型提供实时网络搜索功能。通过RAG（Retrieval-Augmented Generation）技术，这些模型的信息获取能力得到了显著增强。RAG技术允许模型在生成答案之前，先从外部知识库中检索相关信息，从而提高答案的准确性和可靠性。

通过与Exa和OpenRouter的合作，开发者可以更灵活地调用各种大语言模型，并利用RAG技术来增强模型的信息获取能力。这将降低开发成本，并拓展AI应用场景。这一合作是RAG技术在AI领域应用的一个重要里程碑。

中国知网推出CNKI AI：学术研究的新助手

中国知网推出了基于人工智能技术的全新探索成果——CNKI AI。该平台通过AI学术研究助手与增强检索的整合，提供更加精准、全面的知识服务。CNKI AI旨在帮助研究人员更高效地查找和利用学术资源。

CNKI AI提供问答式增强检索和生成式知识服务，助力学术研究和科技创新。它具有高质数据与可信可控特性，确保服务高效、精准且可靠。双路检索与段落检索提升了查全查准率，满足多样化的需求。CNKI AI的推出，将极大地提升学术研究的效率和质量。

Anthropic推出Claude Explains博客项目：AI与人类专家协作的新模式

Anthropic推出了名为“Claude Explains”的博客项目，展示其AI模型Claude在内容创作中的能力。博客内容由Claude AI生成并经人类专家编辑，首批文章聚焦技术主题，未来计划扩展至更多领域。

这种AI与人类专家协作的模式，确保了内容的专业性和可读性。Claude AI负责生成内容，而人类专家则负责编辑和增强。这种模式充分发挥了AI的生成能力和人类的专业知识，从而创造出高质量的内容。Claude Explains博客项目的推出，为AI在内容创作领域的应用提供了新的思路。

Claude Pro升级：研究模式与远程MCP整合的新进展

Anthropic宣布Claude Pro新增研究模式和远程MCP整合功能，提升了AI助手的实用性和生产力。研究模式可以将复杂研究任务从小时级压缩到分钟级，大幅提升效率。远程MCP整合功能使Claude Pro用户能够无缝连接多种工具，简化跨平台协作。

升级后的Claude Pro在功能和价格上更具竞争力，吸引了更多用户使用。这些新功能的推出，将进一步提升Claude Pro在AI助手市场的竞争力，并推动其在更多场景中的应用。

Fish Audio推出OpenAudio S1：超自然语音模型的新标杆

Fish Audio推出的OpenAudio S1，是一款基于大量数据训练的文本转语音模型。它在语音自然度和情感表达方面表现突出，还提供了灵活的双版本选择，为企业和开发者提供了高效且经济的语音生成解决方案。

OpenAudio S1模型基于200万小时音频训练，支持多样语言风格与情感表达。它提供S1（40亿参数）和S1-mini(5亿参数)两种版本，满足不同场景需求。通过使用RLHF技术，OpenAudio S1能够生成情感化语音，提升用户体验并降低成本。OpenAudio S1的推出，为语音生成领域带来了新的突破。

OpenAI Codex升级：语音输入和联网功能助力编程更智能

OpenAI对其编程工具Codex进行了全面升级，新增了语音输入和联网能力，同时降低了使用门槛，提升了开发者的编程效率。这些升级旨在使编程更加智能和便捷。

新增联网功能后，Codex可以自动完成环境配置、代码检查和测试，开发者可以专注于逻辑和功能实现。语音输入功能让开发者能够更自然地传达指令，提高工具易用性。Codex现在向ChatGPT Plus用户开放，降低了使用门槛，让更多开发者受益。

OpenAI升级AI智能体开发工具：支持TypeScript、改进语音对话

OpenAI对其AI智能体开发工具进行了重要升级，包括新增TypeScript支持、优化语音界面、增强可观测性以及改进语音对语音模型。这些升级旨在提升AI智能体的开发效率和用户体验。

TypeScript支持使JavaScript和Node.js开发者也能参与智能体开发。RealtimeAgent功能支持低延迟语音应用，可暂停执行并手动确认智能体状态，适合监管场景。语音模型改进优化了语音对语音模型，降低延迟、提高对话自然性与中断处理能力。

华为WATCH5智能手表：双大模型加持，运动健康体验全面升级

HUAWEI正式发布WATCH5智能手表，通过接入盘古大模型和DeepSeek大模型，在语音交互、健康监测及生态互联方面实现了突破性提升。这意味着智能手表在健康和运动领域将发挥更大的作用。

WATCH5支持双AI大模型，语音交互更便捷且健康数据分析更精准。腕上小艺功能可分析20+运动与健康领域近200项指标，提供个性化指导。它还支持生态互联，兼容华为设备及其他第三方健康管理平台，助力全面健康生活。华为WATCH5的推出，为智能手表市场带来了新的活力。

DeepSeek被指使用Google Gemini数据训练新AI模型

DeepSeek最近发布的R1推理AI模型更新版在多项基准测试中表现出色，但其训练数据来源引发争议。有开发者指出其模型与Google Gemini系列有相似之处，且DeepSeek此前也被指控通过“数据蒸馏”技术训练模型。尽管如此，AI界普遍认为这种现象可能源于模型间的相互模仿。

DeepSeek R1模型在数学和编程测试中表现优异，但其训练数据来源存疑。多位开发者指出DeepSeek模型与Google Gemini系列有相似的用词和表达风格。OpenAI发现DeepSeek可能通过“数据蒸馏”技术获取训练数据，违反了相关规则。这一事件引发了人们对AI模型训练数据来源的关注。

松下推出“OmniFlow”：多模态生成AI实现文本、图像与音频的自由转换

松下控股公司联合UCLA研究人员开发了名为“OmniFlow”的多模态生成AI，具备“任意对任意”生成能力，可实现文本、图像和音频间的自由转换，降低数据采集成本并提升生成效率。

创新技术“OmniFlow”支持文本、图像、音频自由转换，大幅提升多模态生成AI的应用潜力。数据需求低至传统方法的1/60，显著降低数据采集成本，优化模型训练效率。在文本转图像和文本转音频任务中表现最优，展现最佳性能，未来有望应用于工厂与生活方式领域。OmniFlow的推出，为多模态生成AI的发展带来了新的机遇。

总的来说，人工智能领域正在以惊人的速度发展。从OpenAI的ChatGPT到华为的智能手表，每一项新的技术和应用都为我们的生活带来了更多的便利和可能性。随着技术的不断进步，我们有理由相信，人工智能将在未来发挥更大的作用。