AI前沿动态:ChatGPT记忆开放、华为手表双模型、多模态AI新突破

1

在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到我们生活的方方面面。从OpenAI的ChatGPT到华为的智能手表,AI技术的每一次进步都引发了业界的广泛关注。本文将深入剖析近期AI领域的几大热点事件,带您洞悉技术趋势,了解创新AI产品应用。

OpenAI 免费开放 ChatGPT 记忆功能:个性化对话体验的新篇章

OpenAI 近期宣布,将记忆功能免费向所有 ChatGPT 用户开放,这无疑是AI领域的一项重大进展。这一举措意味着,即使是免费用户,也能体验到 ChatGPT 在对话连续性上的提升。ChatGPT 能够记住用户之前的对话内容,并在后续的交流中加以应用,从而实现更加个性化和连贯的对话体验。

对于付费用户而言,这一功能的提升更为显著。他们可以引用更久远的对话记录,享受更高便捷性和深度互动。用户还可以随时管理记忆设置,关闭或删除特定记忆内容,充分保护个人隐私。这一功能的开放,无疑将进一步提升 ChatGPT 的用户粘性和市场竞争力。

aibase

蚂蚁集团推出 “AI 健康管家”:智能健康服务惠及千万用户

蚂蚁集团的 “AI 健康管家” 近期通过了信通院医疗健康行业大模型可信评估,成为首批通过评估的产品之一。这标志着蚂蚁集团在医疗AI领域的持续探索和领先地位。据了解,“AI 健康管家” 已经服务超过 4000 万用户,并有 60 多位知名医生 AI 智能体入驻,提供预约医生、健康评估、医疗报告解读等个性化服务。

“AI 健康管家” 的推出,不仅提升了医疗服务的效率和便捷性,也为用户提供了更加个性化和智能化的健康管理方案。通过可信评估,也确保了其安全性和有效性,为用户提供可靠的健康保障。

Anthropic 开设免费课程:掌握 MCP 构建 AI 应用程序

Anthropic 与 DeepLearning.AI 合作推出免费课程 ‘MCP: 使用模型上下文协议构建富上下文 AI 应用’,旨在帮助开发者掌握 MCP 协议,简化 AI 应用与外部工具和数据的连接。MCP 是一种通用协议,通过标准化 LLM 与外部数据源的交互方式,提升上下文处理能力。该课程涵盖 MCP 核心概念、架构及实践项目,帮助开发者快速上手并构建智能 AI 应用。MCP 开源且支持多种工具和数据源集成,有望推动 AI 开发标准化与跨领域融合。

微信截图_20250604085714.png

谷歌 DeepMind 推出新技术:无需 3D 模型也能生成真实运动视频

谷歌 DeepMind 团队与布朗大学合作开发了 ‘力提示’ 技术,无需 3D 模型和物理引擎即可生成逼真的运动效果。用户通过指定力的方向和强度就能操控 AI 生成的视频内容。这项技术极大地简化了运动视频的生成过程,降低了对专业技能和硬件设备的需求。

该模型具备强大的泛化能力,能够适应新场景和物体,甚至掌握部分物理规则。这意味着,用户可以通过简单的文本指令,创造出各种各样生动逼真的运动视频。

image.png

Exa 联手 OpenRouter:400+AI 模型解锁网络搜索,引爆 RAG 革命

Exa 与 OpenRouter 合作,为超过 400 种大语言模型提供实时网络搜索功能,通过 RAG 技术增强模型的信息获取能力,革新 AI 交互体验。这意味着,这些 AI 模型能够动态获取最新的网络信息,突破传统知识更新的局限。

开发者可以通过 OpenRouter 灵活调用,降低开发成本,拓展 AI 应用场景。这一合作将极大地提升 AI 模型的实用性和智能化水平。

中国知网推出 CNKI AI:打造智能学术研究助手

中国知网推出了基于人工智能技术的全新探索成果 —— CNKI AI。该平台通过 AI 学术研究助手与增强检索的整合,提供更加精准、全面的知识服务。CNKI AI 提供问答式增强检索和生成式知识服务,助力学术研究和科技创新。高质数据与可信可控特性确保服务高效、精准且可靠。双路检索与段落检索提升查全查准率,满足多样化需求。

image.png

Anthropic 推出 Claude Explains 博客项目:探索 AI 与人类专家协作新模式

Anthropic 推出了名为 'Claude Explains' 的博客项目,展示其 AI 模型 Claude 在内容创作中的能力。博客内容由 Claude AI 生成并经人类专家编辑,首批文章聚焦技术主题,未来计划扩展至更多领域。这一项目旨在探索 AI 与人类专家在内容创作领域的协作模式,充分发挥 AI 的生成能力和人类专家的专业知识。

image.png

Claude Pro 升级:研究模式与远程 MCP 整合全面开放

Anthropic 宣布 Claude Pro 新增研究模式和远程 MCP 整合功能,旨在提升 AI 助手的实用性和生产力。研究模式可以将复杂研究任务从小时级压缩到分钟级,大幅提升效率。远程 MCP 整合功能使 Claude Pro 用户能无缝连接多种工具,简化跨平台协作。升级后的 Claude Pro 在功能和价格上更具竞争力,有望吸引更多用户。

image.png

Fish Audio 推出 OpenAudio S1:200 万小时数据驱动的超自然语音模型

Fish Audio 近期推出了 OpenAudio S1,这款基于大量数据训练的文本转语音模型,不仅在语音自然度和情感表达方面表现突出,还提供了灵活的双版本选择,为企业和开发者提供了高效且经济的语音生成解决方案。OpenAudio S1 模型基于 200 万小时音频训练,支持多样语言风格与情感表达。同时,提供 S1(40 亿参数)和 S1-mini(5 亿参数) 两种版本,满足不同场景需求。通过使用 RLHF 技术,生成情感化语音,提升用户体验并降低成本。

image.png

OpenAI Codex 升级:语音输入和联网功能助力编程更智能

OpenAI 对其编程工具 Codex 进行了全面升级,新增了语音输入和联网能力,同时降低了使用门槛,提升了开发者的编程效率。新增联网功能后,Codex 可自动完成环境配置、代码检查和测试,开发者可以专注于逻辑和功能实现。语音输入功能让开发者能更自然地传达指令,提高工具易用性。Codex 现已向 ChatGPT Plus 用户开放,降低使用门槛,让更多开发者受益。

image.png

OpenAI 升级 AI 智能体开发工具:支持 TypeScript 、改进语音对话

OpenAI 对其 AI 智能体开发工具进行了重要升级,包括新增 TypeScript 支持、优化语音界面、增强可观测性以及改进语音对语音模型。Agents SDK 增加了对 TypeScript 的支持,使 JavaScript 和 Node.js 开发者也能参与智能体开发。RealtimeAgent 功能支持低延迟语音应用,可暂停执行并手动确认智能体状态,适合监管场景。通过优化语音对语音模型,降低延迟、提高对话自然性与中断处理能力。

image.png

华为 WATCH5 智能手表接入双大模型:运动健康体验全面升级

HUAWEI 发布 WATCH5 智能手表,通过接入盘古大模型和 DeepSeek 大模型,在语音交互、健康监测及生态互联方面实现突破性提升。WATCH5 支持双 AI 大模型,语音交互更便捷且健康数据分析更精准。腕上小艺功能可分析 20+ 运动与健康领域近 200 项指标,提供个性化指导。同时,支持生态互联,兼容华为设备及其他第三方健康管理平台,助力全面健康生活。

image.png

DeepSeek 可能使用了 Google Gemini 数据训练新 AI 模型

DeepSeek 最近发布的 R1 推理 AI 模型更新版在多项基准测试中表现出色,但其训练数据来源引发争议。有开发者指出其模型与 Google Gemini 系列有相似之处,且 DeepSeek 此前也被指控通过 “数据蒸馏” 技术训练模型。尽管如此,AI 界普遍认为这种现象可能源于模型间的相互模仿。

松下推出 “OmniFlow” 多模态生成 AI:实现文本、图像与音频的自由转换

松下控股公司联合 UCLA 研究人员开发了名为 “OmniFlow” 的多模态生成 AI,具备 “任意对任意” 生成能力,可实现文本、图像和音频间的自由转换,降低数据采集成本并提升生成效率。创新技术 ‘OmniFlow’ 支持文本、图像、音频自由转换,大幅提升多模态生成 AI 的应用潜力。数据需求低至传统方法的 1/60,显著降低数据采集成本,优化模型训练效率。在文本转图像和文本转音频任务中表现最优,展现最佳性能,未来有望应用于工厂与生活方式领域。

image.png

总结

从 ChatGPT 的记忆功能开放,到蚂蚁集团的 AI 健康管家,再到华为 WATCH5 智能手表的双大模型接入,AI 正在以惊人的速度渗透到我们生活的方方面面。这些技术不仅提升了效率、便捷性,也为我们带来了更加个性化、智能化的体验。随着 AI 技术的不断发展,我们有理由相信,未来的生活将更加美好。