AI日报：ChatGPT企业级应用，Midjourney视频功能，AI创新加速

在人工智能领域，每天都有新的突破和进展。今天，我们为您带来一份详尽的AI日报，深入剖析最新的技术动态和创新应用，助您把握AI发展的脉搏。

ChatGPT的企业级应用与协作增强

OpenAI近日宣布，ChatGPT迎来了两项重大更新：Model Context Protocol (MCP) 支持和会议记录功能。这两项功能的推出，无疑将极大地提升ChatGPT在企业环境中的实用性和效率。

MCP支持使得ChatGPT能够无缝连接企业内部数据，实现私域知识的智能检索与分析。这意味着企业可以利用ChatGPT更高效地处理和分析内部数据，从而做出更明智的决策。这种能力对于需要处理大量数据的企业来说，无疑是一项强大的助力。

会议记录模式则专注于提高团队协作效率。该模式能够自动转录会议内容，并生成关键要点和行动计划。这不仅节省了手动整理会议记录的时间，还确保了所有参与者都能够清晰地了解会议的核心内容和后续行动。

此外，OpenAI还与微软Azure合作，进一步增强了ChatGPT在企业场景中的安全性和可扩展性。这表明OpenAI正在积极拓展其企业级应用，并致力于为企业提供更安全、更可靠的AI解决方案。

Cursor 1.0：AI驱动的代码审查与远程开发

Cursor 1.0的正式发布，标志着AI在软件开发领域的应用进入了一个新的阶段。新版本带来了BugBot、Background Agent、Jupyter支持及Memories功能，旨在显著提升开发效率。

BugBot作为一项自动化代码审查与修复工具，能够减少手动审查时间，提升团队协作效率。它可以自动检测代码中的潜在错误，并提供修复建议，从而帮助开发者更快地发现和解决问题。

Background Agent则专注于提供流畅的远程编码体验，优化多设备开发一致性。对于需要进行远程协作的开发团队来说，这项功能无疑是一大福音。它可以确保所有开发者都能够在相同的环境下工作，从而减少协作中的摩擦。

新增的Jupyter支持与Memories功能，则分别助力数据科学与项目管理。Jupyter支持使得开发者可以直接在Cursor中进行数据分析和可视化，而Memories功能则可以帮助开发者更好地管理和回顾项目历史。

Midjourney的视频功能：AI创意的新纪元

Midjourney即将上线视频功能，无疑将为AI创意领域带来一场革命。与此同时，V7.1和V8模型的开发也在加速推进，预示着Midjourney在图像生成领域的实力将得到进一步提升。

初期，Midjourney的视频功能将主要支持图像到视频的转换，价格亲民，年度订阅用户将享有优先体验。这意味着用户可以通过简单的操作，将静态图像转化为生动的视频内容，从而创造出更具吸引力的作品。

为了支持视频生成与模型优化，Midjourney正在加速服务器扩容，以确保流畅的用户体验。此外，风格引用功能也得到了升级，不仅提升了准确性，还新增了随机风格生成，为用户提供了更多的创意选择。

秘塔AI搜索的PPT导出功能

秘塔AI搜索旗下的“今天学点啥”平台，新增了PPT导出功能，允许用户下载包含图文、语音和逐字稿的完整PPT。这一功能的推出，无疑将极大地提升用户的学习效率。

用户只需在视频讲解页面点击“导出PPT”按钮，即可下载所需的PPT文件。由于平台算力限制，导出功能在前三天免费，后续将消耗计算额度。不过，注册用户都将获得初始赠送额度，可以免费体验该功能。

此功能的上线，源于用户的积极反馈，体现了平台对用户需求的重视与快速响应能力。通过不断优化和改进，秘塔AI搜索正在努力为用户提供更优质的学习体验。

微信截图_20250605102004.png

Manus挑战OpenAI Sora：文生视频的新选择

AI初创公司Manus推出了“文生视频”功能，用户可通过文本指令生成视频，直接与OpenAI的Sora展开竞争。这一举动，无疑将为AI视频创作领域带来更多的选择。

Manus的“文生视频”功能，支持Basic、Plus和Pro会员抢先体验。与OpenAI的Sora类似，Manus也提供了灵活的会员制度，以满足不同用户的需求。

随着技术的不断进步，AI视频创作的门槛正在逐渐降低。像Manus这样的公司，正在通过技术创新，推动AI视频创作的普及，为内容创作者提供更高效的工具，加速行业创新与发展。

Mistral Code：挑战GitHub Copilot的企业编码助手

法国AI巨头Mistral推出了企业编码助手Mistral Code，旨在通过本地部署和深度定制能力，挑战GitHub Copilot的市场地位。这款产品结合了最新的AI模型与IDE插件，提供垂直集成解决方案，以解决企业采用AI编码助手的关键障碍。

Mistral Code提供本地部署和深度定制能力，确保代码安全不离开公司服务器。这对于注重数据安全的企业来说，无疑是一项重要的优势。

通过垂直集成产品，Mistral Code旨在解决企业采用AI编码助手的四大障碍，提供全面支持。此外，Mistral Code还拥有强大的开源Devstral模型，性能优越且适合企业级数据隐私需求。

英伟达Llama Nemotron Nano VL AI：高精度文档处理解决方案

英伟达发布了Llama Nemotron Nano VL，这是一款基于Llama3.1架构的紧凑型视觉-语言模型，专为文档智能处理优化。该模型在OCR Bench v2中表现优异，支持多模态输入与灵活部署。

Llama Nemotron Nano VL的参数仅为8B，但性能卓越，支持多页文档、表格、图表等复杂场景。在OCRBench v2测试中，该模型表现出了高精度和泛化能力。

此外，Llama Nemotron Nano VL还支持灵活部署，可以从云端到边缘设备，开源且兼容多种框架。这使得企业可以根据自身的需求，选择最适合的部署方式。

腾讯公益引入AI大模型：提升公益项目互动体验

腾讯公益首次引入AI大模型，推出了“问 AI”功能，旨在利用大型人工智能模型提升公众与公益组织的互动和透明度。与此同时，腾讯公益还结合AI通识公益课程，拓展教育资源。

用户可以通过“问 AI”功能，即时获取腾讯公益项目信息，增强参与感。此外，腾讯还与清华大学合作推出了AI通识公益课程，惠及7000余名学生。

借助AI技术，公益项目效率得到了提升，未来的创新路径也得到了拓宽。这表明AI在公益领域的应用，具有巨大的潜力。

Firecrawl /search API：AI数据处理进入新时代

Firecrawl推出的/search API，通过一次API调用即可实现网页搜索与内容抓取，极大地简化了数据获取流程。该API支持多格式输出且完全后端运行，非常适合AI开发者使用。

通过一次API调用，Firecrawl /search API无需手动解析复杂搜索结果，即可快速获取网页完整内容。该API支持Markdown、HTML、纯链接和截图等多种格式输出，以满足不同AI模型的数据需求。

作为一个社区驱动的开源工具，Firecrawl在GitHub上获得了超过10K Star，并提供了Python和Node.js SDK，降低了开发门槛。

Bland TTS：语音AI的终极突破

Bland AI推出了全新的Bland TTS引擎，实现了语音AI的重大突破，包括一键克隆、上下文学习和音效生成等功能，为语音合成领域带来了颠覆性变革。

Bland TTS引擎仅需一段短音频即可精准克隆任意人声，大幅降低了技术门槛。此外，该引擎还引入了上下文学习，可以根据语义动态调整语气和情感，提升自然度。

Bland TTS引擎还支持音效生成，扩展至多维度声音创作，增强沉浸式体验。这使得用户可以创造出更具表现力的语音内容。

AI成本结构：训练成本飙升，推理成本暴跌

知名投资人Mary Meeker的最新AI报告揭示了AI行业面临的成本结构矛盾：训练成本持续飙升至百亿级别，而推理成本却因硬件与算法突破骤降99%。这种分化正在重塑AI产业的商业化格局。

训练成本的指数级增长，形成头部玩家才能参与的军备竞赛，将大量中小型企业挤出赛道。而推理成本因硬件迭代雪崩式下降，推动AI应用大规模普及，降低开发者创新门槛。

AI行业正面临烧钱与构建技术壁垒的平衡挑战，网络效应成为可持续盈利的关键。

Jaaz：开源AI设计Agent的崛起

Jaaz是一款开源AI设计Agent，支持通过简单的API配置实现自动化批量图像生成，为专业创作者和团队提供了高效的解决方案。

Jaaz通过简单API配置实现批量图像生成，适合快速生成大量视觉内容。虽然当前版本API支持有限，但开源特性为未来扩展提供了可能。

未来，Jaaz有望扩展为全能型创意平台，满足多样化需求。

《逆水寒》手游与可灵AI合作：图生动图的新玩法

《逆水寒》手游与可灵AI达成合作，推出了全新“图生动图”玩法，玩家可通过简单操作将静态图片转化为动感画面，享受个性化创作的乐趣。

通过简单的操作，玩家可以轻松创作个性化动图，提升游戏趣味性。该玩法还支持双人互动，创造温馨有趣的亲密场景。

不过，动图生成为付费服务，费用依品质与时长而定。

总的来说，今天AI领域的进展涵盖了企业应用、软件开发、图像视频生成、语音合成等多个方面。这些技术创新不仅提升了效率，也为各行各业带来了新的可能性。我们期待未来AI技术能够继续发展，为人类创造更多的价值。