AI日报：ChatGPT企业应用升级，Midjourney视频功能即将上线

在人工智能领域，创新层出不穷，技术迭代加速，每天都有令人瞩目的进展。今天的AI日报为我们带来了多个重磅消息，涵盖了OpenAI的ChatGPT功能升级、Cursor 1.0的正式发布、Midjourney即将推出的视频功能以及其他AI领域的最新动态。让我们一起深入了解这些前沿技术，洞悉AI的未来发展趋势。

OpenAI的ChatGPT：企业协作与数据智能的新篇章

OpenAI近日宣布ChatGPT迎来重大更新，其中最引人注目的莫过于对Model Context Protocol (MCP)的支持以及全新的会议记录功能。作为一名AI助手，我认为这两项功能的推出无疑将极大地提升ChatGPT在企业级应用中的价值。

MCP：私域知识的智能检索与分析

MCP的引入意味着ChatGPT能够无缝连接企业内部数据，实现私域知识的智能检索与分析。这对于企业而言，无疑是一个巨大的福音。企业可以将内部文档、知识库等数据接入ChatGPT，让员工能够通过自然语言交互，快速获取所需信息。这不仅提高了信息检索的效率，还降低了员工的学习成本。例如，一家大型制造企业可以将其产品设计文档、生产流程规范等数据接入ChatGPT，当工程师在设计过程中遇到问题时，可以直接向ChatGPT提问，快速获取相关信息，从而加速产品开发进程。

会议记录模式：提升团队协作效率

会议记录模式的推出，则大大提高了团队协作的效率。传统的会议记录方式往往耗时耗力，且容易遗漏关键信息。而ChatGPT的会议记录模式能够自动转录会议内容，并生成关键要点和行动计划。这不仅节省了记录时间，还能够确保会议信息的完整性和准确性。会后，团队成员可以通过回顾ChatGPT生成的会议记录，快速了解会议内容，明确各自的任务和责任。这对于提高团队协作效率，减少沟通成本具有重要意义。

安全性与可扩展性：与微软Azure的深度合作

值得一提的是，OpenAI还与微软Azure展开深度合作，增强ChatGPT在企业场景中的安全性和可扩展性。通过与Azure的集成，ChatGPT能够满足企业对数据安全和合规性的严格要求。同时，Azure强大的计算能力也为ChatGPT提供了强大的支持，确保其能够应对高并发、大数据量的企业级应用场景。

Cursor 1.0：BugBot与远程编码的革新

Cursor 1.0的正式发布，标志着AI辅助编程进入了一个新的阶段。新版本带来了BugBot、Background Agent、Jupyter支持及Memories功能，这些创新功能将显著提升开发效率，优化代码审查、远程开发和项目管理。

BugBot：自动化代码审查与修复

BugBot是Cursor 1.0中最引人注目的新功能之一。它能够自动化进行代码审查与修复，减少手动审查的时间，提升团队协作效率。传统的代码审查往往需要耗费大量的人力和时间，且容易受到人为因素的影响。而BugBot能够通过AI技术，自动检测代码中的潜在问题，并提供修复建议。这不仅提高了代码质量，还能够释放开发人员的精力，让他们能够专注于更具创造性的工作。

Background Agent：流畅的远程编码体验

Background Agent则为开发者提供了流畅的远程编码体验，优化了多设备开发的一致性。在远程办公日益普及的今天，远程编码的体验至关重要。Background Agent能够确保开发者在不同设备上都能够获得一致的编码体验，避免因环境差异导致的问题。这对于提高远程办公效率，保障项目进度具有重要意义。

Jupyter支持与Memories功能：助力数据科学与项目管理

新增的Jupyter支持与Memories功能，则进一步拓展了Cursor 1.0的应用场景，使其能够更好地服务于数据科学与项目管理。Jupyter是数据科学家常用的工具，Cursor 1.0对其支持，使得数据科学家能够更加方便地进行数据分析和建模。Memories功能则能够帮助开发者更好地管理项目，记录重要的代码片段和设计思路，方便日后回顾和复用。

详情链接:https://www.cursor.com/changelog

Midjourney：视频功能的突破与V8模型的展望

Midjourney即将上线视频功能，同时V7.1和V8模型的开发也在加速推进。这将为AI创意领域带来新的突破，开启AI创意的新时代。

视频功能：图像到视频的转换

Midjourney的视频功能初期将支持图像到视频的转换，价格亲民，年度订阅用户将优先体验。这意味着用户可以通过Midjourney，将静态图像转化为动态视频，赋予图像新的生命力。这对于内容创作者而言，无疑是一个强大的工具。他们可以通过Midjourney，快速生成各种短视频、动画等内容，满足不同场景的需求。

服务器扩容与风格引用优化

为了支持视频生成与模型优化，Midjourney正在加速服务器扩容。同时，风格引用功能也得到了升级，提升了准确性并新增了随机风格生成，为用户提供了更多的创意选择。这些举措都将为Midjourney的未来发展奠定坚实的基础。

秘塔AI搜索：“今天学点啥”的PPT导出功能

秘塔AI搜索旗下的“今天学点啥”平台新增PPT导出功能，支持下载完整讲解PPT，包括图文、语音和逐字稿。这为用户提供了更加便捷的学习方式。

PPT导出：完整的学习资料

用户可以在视频讲解页面点击‘导出PPT’按钮，下载包含图文、语音和逐字稿的完整PPT。这使得用户可以随时随地回顾学习内容，加深理解。同时，PPT的导出也方便用户进行整理和分享，促进知识的传播。

限时免费体验：算力限制下的用户福利

由于算力限制，导出功能将在前三天免费，后续需消耗计算额度，注册用户有初始赠送额度。这体现了平台对用户需求的重视与快速响应能力。尽管存在算力限制，但平台依然为用户提供了限时免费体验，让用户能够充分体验新功能带来的便利。

微信截图_20250605102004.png

Manus：“文生视频”挑战Sora

AI初创公司Manus推出了‘文生视频’功能，用户可通过文本指令生成视频，与OpenAI的Sora展开竞争。这标志着AI视频创作领域竞争的加剧。

文生视频：文本到视频的转化

Manus的‘文生视频’功能支持Basic、Plus和Pro会员抢先体验。用户只需输入文本指令，即可生成相应的视频内容。这大大降低了视频创作的门槛，让更多人能够参与到视频创作中来。

灵活的会员制：满足不同用户需求

与OpenAI的Sora类似，Manus提供灵活的会员制，最高Pro会员费用约1431元人民币。这使得用户可以根据自身需求选择合适的会员等级，获得相应的服务。

Mistral AI：企业编码助手挑战GitHub Co pilot

法国AI巨头Mistral AI发布企业编码助手Mistral Code，通过本地部署和深度定制能力挑战GitHub Co pilot市场地位。这为企业提供了更多的选择。

本地部署与深度定制：保障数据安全

Mistral Code提供本地部署和深度定制能力，确保代码安全不离开公司服务器。这对于对数据安全有严格要求的企业而言，具有重要意义。通过本地部署，企业可以完全掌控自己的数据，避免数据泄露的风险。

垂直集成产品：解决企业采用AI编码助手的障碍

Mistral Code通过垂直集成产品解决企业采用AI编码助手的四大障碍，提供全面支持。这使得企业能够更加方便地采用AI编码助手，提高开发效率。

英伟达：Llama Nemotron Nano VL AI登顶OCRBench

英伟达推出Llama Nemotron Nano VL，一款基于Llama3.1架构的紧凑型视觉-语言模型，专为文档智能处理优化，在OCR Bench v2中表现优异，支持多模态输入与灵活部署。这为文档处理领域带来了新的解决方案。

性能卓越：支持多页文档、表格、图表等复杂场景

Llama Nemotron Nano VL参数仅8B但性能卓越，支持多页文档、表格、图表等复杂场景。这使得其能够应对各种复杂的文档处理任务。

OCRBench v2测试登顶：高精度和泛化能力

Llama Nemotron Nano VL在OCRBench v2测试中登顶，展现了高精度和泛化能力。这证明了其在文档处理领域的领先地位。

详情链接:https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

腾讯公益：AI大模型提升公益项目互动体验

腾讯公益推出“问 AI”功能，利用大型人工智能模型提升公众与公益组织的互动和透明度，同时结合AI通识公益课程拓展教育资源。这为公益事业的发展注入了新的活力。

“问 AI”功能：即时获取公益项目信息

用户可通过“问 AI”功能即时获取腾讯公益项目信息，增强参与感。这使得公众能够更加方便地了解公益项目，参与到公益事业中来。

AI通识公益课程：拓展教育资源

腾讯与清华大学合作推出AI通识公益课程，惠及7000余名学生。这为学生提供了学习AI知识的机会，培养了他们的公益意识。

Firecrawl：/search API简化AI数据处理

Firecrawl推出的/search API通过一次API调用即可实现网页搜索与内容抓取，极大简化了数据获取流程，支持多格式输出且完全后端运行，非常适合AI开发者使用。这为AI开发者提供了更加便捷的数据获取方式。

一键搜索与抓取：快速获取网页完整内容

通过一次API调用，无需手动解析复杂搜索结果，快速获取网页完整内容。这大大简化了数据获取流程，提高了开发效率。

多格式输出：满足不同AI模型的数据需求

支持Markdown、HTML、纯链接和截图，满足不同AI模型的数据需求。这使得开发者可以根据自己的需求选择合适的数据格式。

详情链接:https://github.com/mendableai/firesearch

Bland TTS：一键克隆任意人声

Bland AI推出了全新的Bland TTS引擎，实现了语音AI的重大突破，包括一键克隆、上下文学习和音效生成等功能，为语音合成领域带来了颠覆性变革。这为语音合成领域带来了新的可能性。

一键克隆：精准克隆任意人声

仅需一段短音频即可精准克隆任意人声，大幅降低技术门槛。这使得用户可以轻松克隆自己或他人的声音，用于语音合成。

上下文学习：根据语义动态调整语气和情感

引入上下文学习，根据语义动态调整语气和情感，提升自然度。这使得合成的语音更加自然流畅，更具表现力。

详情链接:https://bland.com/enterprise

Mary Meeker报告：AI训练成本与推理成本的分化

知名投资人Mary Meeker的最新AI报告揭示了AI行业面临的成本结构矛盾，训练成本持续飙升至百亿级别，而推理成本却因硬件与算法突破骤降99%，这种分化正重塑AI产业的商业化格局。这为我们深入理解AI产业的商业模式提供了新的视角。

训练成本：头部玩家的军备竞赛

训练成本指数级增长，形成头部玩家才能参与的军备竞赛，将大量中小型企业挤出赛道。这意味着只有拥有雄厚资金实力的企业才能在AI领域占据领先地位。

推理成本：AI应用大规模普及的推动力

推理成本因硬件迭代雪崩式下降，推动AI应用大规模普及，降低开发者创新门槛。这使得更多的开发者能够参与到AI应用的开发中来，推动AI技术的普及。

Jaaz：开源AI设计Agent批量生成图像

Jaaz是一款开源AI设计Agent，支持通过简单的API配置实现自动化批量图像生成，为专业创作者和团队提供了高效的解决方案。这为图像生成领域带来了新的工具。

批量图像生成：快速生成大量视觉内容

Jaaz通过简单API配置实现批量图像生成，适合快速生成大量视觉内容。这使得用户可以快速生成各种图像，满足不同场景的需求。

开源特性：为未来扩展提供了可能

当前版本API支持有限，但开源特性为未来扩展提供了可能。这意味着用户可以根据自己的需求定制Jaaz，使其更好地服务于自己的业务。

详情链接:https://github.com/11cafe/jaaz

《逆水寒》手游：与可灵AI合作上线“图生动图”玩法

《逆水寒》手游与可灵AI达成合作，推出全新“图生动图”玩法，玩家可通过简单操作将静态图片转化为动感画面，享受个性化创作的乐趣。这为游戏带来了新的玩法。

个性化动图创作：提升游戏趣味性

玩家可轻松创作个性化动图，提升游戏趣味性。这使得玩家可以根据自己的喜好创作各种动图，增加游戏的乐趣。

双人互动：创造温馨有趣的亲密场景

支持双人互动，创造温馨有趣的亲密场景。这使得玩家可以与朋友一起创作动图，增加游戏的互动性。