AI Daily：智谱发布AI Slides，Ke Ling AI发布Keltu 2.1模型

在人工智能领域，创新浪潮持续涌动，各大科技公司纷纷推出令人瞩目的新产品和模型。本文将深入探讨智谱AI、科 लिंग AI、英伟达、Moba AI、Higgsfield AI、谷歌DeepMind以及Mistral AI等公司在AI领域的最新动态，并分析其技术突破与应用前景。

智谱AI：AI Slides——PPT生成的革新

智谱AI推出了一项名为AI Slides的创新功能，该功能基于强大的GLM-Experimental模型，旨在快速生成高质量的PPT演示文稿。用户只需提供主题或文档，AI Slides即可自动创建结构清晰、数据图表直观的演示文稿。更令人惊喜的是，这项功能完全免费，用户可以通过chat.z.ai体验。

AI Slides的出现，无疑为职场人士和学生带来了福音。传统的PPT制作过程繁琐耗时，而AI Slides能够大幅缩短制作时间，提高工作效率。其自动生成的图表和清晰的结构，也有助于提升演示文稿的质量和吸引力。此外，免费使用的策略也降低了用户的使用门槛，有望迅速普及。

科 लिंग AI：Keltu 2.1模型——图像生成的飞跃

科 लिंग AI发布了全新的图像生成模型Keltu 2.1，该模型在指令遵循、人像美化和电影质感等方面实现了显著提升，同时具备强大的文本生成能力。Keltu 2.1支持超过180种风格，为用户提供了更丰富的创作选择。

Keltu 2.1的卓越性能，使其在图像生成领域具有强大的竞争力。其对复杂指令的精准理解和执行能力，能够生成符合用户期望的高质量图像。此外，180多种风格的支持，也为用户提供了更大的创作空间，可以满足不同场景下的需求。科 लिंग AI还提供7天免费试用，让用户充分体验Keltu 2.1的强大功能。

英伟达：DiffusionRenderer——视频到3D场景的突破

英伟达及其合作伙伴推出了一项名为DiffusionRenderer的突破性技术，该技术结合了视频生成和编辑功能，能够理解和操作3D场景。DiffusionRenderer通过神经逆渲染器和神经正向渲染器协同工作，增强了视频的真实感和适应性，并在多个任务中表现出色。

DiffusionRenderer的出现，为视频创作带来了新的可能性。它不仅可以生成逼真的3D场景，还可以对场景进行编辑和修改，从而实现更灵活的创作流程。动态光照、材质编辑和对象插入等功能，也为创作者提供了更多的工具和选择。这项技术有望在游戏开发、电影制作等领域得到广泛应用。

Moba AI：30秒生成高保真原型

Moba AI推出了一项新的原型生成功能，允许用户在短短30秒内根据想法生成高保真、可编辑的原型。该功能支持多轮对话优化和本地修改，从而提高产品设计和验证效率。

Moba AI的原型生成功能，无疑将极大地提高产品设计的效率。设计师可以通过该功能快速将想法转化为可编辑的原型，并进行多轮迭代优化。多终端适配和多轮对话优化功能，也能够帮助设计师更好地满足用户需求。此外，该功能还支持多种图像输入，可以智能解析草图、线框图等，从而生成界面。

Higgsfield AI：Soul ID——重塑你的数字身份

Higgsfield AI推出了一款名为Soul ID的革命性AI工具，该工具可以通过上传10张以上的个人照片，生成高度个性化的虚拟化身。Soul ID的核心功能包括逼真度和多样性的完美融合、多样化的风格预设以及自动提示优化，为内容创作者和时尚博主提供了强大的创意工具。

Soul ID的出现，为用户提供了一种全新的数字身份表达方式。通过上传个人照片，用户可以生成与自己高度相似的虚拟化身，并根据自己的喜好进行风格定制。内置的60多种高级风格预设和自动提示优化功能，也为用户提供了更多的创作灵感和可能性。这项技术有望在社交媒体、虚拟现实等领域得到广泛应用。

谷歌DeepMind：GenAI Processors——构建实时AI工作流

谷歌DeepMind开源了GenAI Processors库，为开发者提供了一个轻量级、高效的工具，用于构建异步、可组合的生成式AI工作流。该库支持多模态数据处理，显著提高了基于Gemini API的应用程序的开发效率。

GenAI Processors的开源，将极大地促进生成式AI技术的发展。通过模块化设计，该库简化了复杂AI工作流的开发过程。对音频、视频和文本等多模态数据的异步流处理支持，也提高了实时应用程序的效率。开源社区的协作，将进一步扩展该库的功能，覆盖更多的场景和编程语言。

谷歌：Veo3——图像转视频功能的 added

谷歌在AI视频生成领域不断前进，推出了图像转视频功能，并加强了内容识别机制，展示了市场对AI创作工具的强劲需求。

谷歌通过Gemini应用程序添加图像转视频功能，进一步扩展了AI创作工具的功能。用户可以通过上传照片生成视频剪辑，并添加描述性音频，支持作品的下载或分享。所有使用Veo3模型生成的视频都将带有可见和不可见的数字水印，以确保内容的可追溯性。这项功能将为用户提供更便捷的视频创作方式，并有望在社交媒体等平台引发新的创作潮流。

Mistral AI：Devstral2507——面向代码的语言模型

Mistral AI与All Hands AI合作推出了Devstral2507系列模型，包括开源的Devstral Small1.1和企业版Devstral Medium2507。这些模型专注于代码推理、程序合成和结构化任务执行，适用于大型软件代码库中的实际应用。Devstral Small1.1在SWE-Bench基准测试中获得53.6%的评分，而Devstral Medium2507获得61.6%的评分，优于某些商业模型。

Devstral2507系列模型的推出，为代码生成和理解带来了新的突破。这些模型专注于代码推理和程序合成，可以帮助开发者更高效地编写和维护代码。Devstral Small1.1和Devstral Medium2507在SWE-Bench基准测试中的优异表现，也证明了其在代码处理方面的强大能力。这些模型支持与代码代理框架集成，适用于从本地开发到企业级服务的各种场景。

总结

从智谱AI的AI Slides到Mistral AI的Devstral2507，各大科技公司在人工智能领域持续发力，不断推出创新产品和模型。这些技术突破不仅提高了工作效率，也为用户带来了更多的创作可能性。随着人工智能技术的不断发展，我们有理由相信，未来的生活将更加便捷和智能化。