AI日报：Manus开放注册，Lovart内测，教育划界，AI发展新动态

在人工智能领域，每一天都充满了变革与创新。2025年5月13日，AI领域再次迎来了一系列令人瞩目的进展。从国产AI智能体Manus的全面开放注册，到全球首款设计Agent Lovart的内测，再到教育部划清AI使用边界，以及昆仑万维开源Matrix-Game大模型等事件，都预示着AI技术正在加速渗透到我们生活的方方面面。本文将深入探讨这些事件，剖析其背后的技术逻辑和潜在影响。

国产AI智能体Manus全面开放注册

国产AI智能体平台Manus的全面开放注册无疑是一个重要的里程碑。此前，Manus以其独特的通用型AI Agent魅力迅速走红，但注册需要邀请码，甚至一度被炒到10万元。如今，无需邀请码即可直接注册并获得积分奖励，这无疑降低了用户的使用门槛，让更多人有机会体验AI带来的便利。

Manus之所以备受关注，在于其创新的工程架构，它巧妙地将思考与行动相结合，极大地提升了用户的创作潜力。这意味着，Manus不仅仅是一个简单的AI工具，它更像是一个智能助手，能够理解用户的意图，并自主执行复杂的任务。这种能力的提升，标志着AI应用正在从简单的信息检索和处理，向更高级的自主决策和执行转变。与阿里通义千问团队的合作，也进一步提升了用户体验。

全球首款设计Agent Lovart内测

Lovart AI推出的全球首款设计Agent，同样是一款具有颠覆性意义的产品。它集成了图像、视频和音乐模型，通过自然语言指令实现全链路自动化设计，让用户只需一句话就能搞定Logo、视频、品牌全套设计。这无疑将极大地提升设计效率，降低设计成本，对于设计师和初创企业来说，无疑是一个福音。

Lovart的核心功能在于任务拆解、跨媒介内容创作及智能图文分离。它能够将复杂的设计任务分解为一系列简单的步骤，然后利用多模态模型自动完成。这种能力不仅可以节省大量的时间和精力，还可以激发用户的创造力，让用户能够更专注于设计的创意和 концептуальность。在Beta测试阶段，Lovart已经表现出色，用户称赞其设计效率提升超5倍，展现出强大的市场潜力。

Lovart AI设计Agent

教育部划清AI使用边界

随着AI技术的普及，其在教育领域的应用也越来越广泛。然而，AI在教育中的使用也引发了一些争议。为了规范AI在教育中的使用，教育部发布了《中小学人工智能通识教育指南（2025年版）》和《中小学生成式人工智能使用指南(2025年版)》，明确禁止学生直接复制AI生成的内容，以防止对独立思考能力的影响。同时，指南还根据不同学段的特点，提出了分阶段的使用策略，强化教师的引导职责，确保学生在安全的环境中合理使用AI工具。

这一举措的意义在于，它既肯定了AI在教育中的积极作用，又强调了对学生独立思考能力的保护。通过分阶段引导和教师的引导，可以帮助学生正确认识和使用AI工具，将其作为辅助学习的工具，而不是替代独立思考的捷径。建立AI工具白名单制度，也能确保校园内使用的AI工具符合教育需求和数据安全合规。

昆仑万维开源Matrix-Game

昆仑万维集团开源的Matrix-Game大模型，是工业界首个开源的10B+空间智能大模型，专注于交互式世界生成。它通过其三大核心部分实现了高质量生成与精确控制。Matrix-Game的开源，无疑将加速AI在游戏、虚拟现实等领域的应用，为开发者提供更多的可能性。

Matrix-Game通过GameWorld Score评测体系，从视觉质量、时序质量等四个维度全面量化性能，超越现有基线模型。它还具备多场景泛化能力，支持不同地形和环境，提升用户交互体验。

Matrix-Game大模型

Google Gemma AI 模型下载量突破1.5亿次

Google的Gemma人工智能模型集合的下载量已突破1.5亿次，显示出其在AI领域的显著进展。Gemma是一款多模态模型，能够处理文本和图像，支持超过100种语言，满足全球用户需求。尽管下载量可观，但仍低于竞争对手Llama的12亿次下载，且因复杂的许可条款受到开发者的批评。

尽管存在一些争议，但Gemma的下载量突破1.5亿次，仍然是一个值得关注的成就。它表明，Google在AI领域的投入正在取得回报，其多模态功能和对多种语言的支持，也使其在国际市场上具有竞争力。

OpenAI推出深度研究报告一键导出PDF功能

OpenAI最近推出了一项新功能，允许用户将其深度研究报告一键导出为PDF格式。这一更新极大提升了报告的实用性和分享效率，特别是在企业环境中。用户可以轻松生成包含引用、表格和图片的专业文档，从而更好地支持决策和沟通。

这一功能的推出，无疑将提升OpenAI的竞争力。通过将尖端AI技术与企业现有工作流程无缝衔接，OpenAI正在推动AI工具的实用化进程。

字节跳动发布统一图像定制框架DreamO

字节跳动在Hugging Face平台推出了DreamO，一个集成多种图像编辑功能的全新框架，标志着AI图像编辑技术的重大突破。DreamO不仅支持换装、换脸、风格迁移等功能，还通过开源特性吸引开发者参与，推动行业创新。其一站式解决方案降低了使用门槛，使得专业设计师和普通用户都能轻松实现高质量的图像编辑。

DreamO图像定制框架

DreamO的开源特性，将促进全球开发者的参与，推动AI图像编辑领域的创新和应用。通过灵活的参数设置，用户可以轻松实现精准的图像编辑，降低了使用门槛，适合各种用户。

月之暗面Kimi界面升级

月之暗面科技有限公司的智能助手Kimi进行了重大界面升级，旨在提升用户体验和信息呈现能力。此次升级引入了多模态容器，支持实时K线图、HTML预览和语音播报等功能，增强了用户与Kimi的互动。尽管新界面引发了一些用户对旧版的怀念，但公司强调这是Kimi成长的一部分，希望通过这些更新让其成为更强大的智能助手。

Kimi界面升级

Kimi支持实时K线图，提供直观的市场走势分析。新增语音播报功能，帮助用户跟踪信息。用户可实时查看Kimi服务状态，增强系统透明度。

阿里MNN神更新

阿里巴巴的MNN项目发布了新版MnnLlmApp，支持Qwen-2.5-Omni-3B和7B模型，极大增强了移动端多模态AI的能力。该应用支持多种模态任务，包括文本、图像和音频的生成与识别，且具备高效性能和低资源占用，吸引了开发者的关注。

MNN神更新

新版MnnLlmApp集成Qwen-2.5-Omni-3B和7B模型，支持文本、图像、音频等多模态任务，提升了综合处理能力。应用完全本地运行，无需联网，确保数据隐私，且在CPU推理上表现卓越，速度远超同类产品。MNN的开源属性和对主流模型的支持，使其成为移动端多模态AI开发的理想平台，推动了行业的快速发展。

ChatGPT 推出 SharePoint 连接器

ChatGPT 最近推出了一项新功能，允许用户通过 SharePoint 连接器访问公司数据。这一功能目前正在测试中，专为 ChatGPT Plus、Pro 和 Team 用户设计。通过此集成，ChatGPT 可以从多个 SharePoint 站点中分析和总结内容，并提供来源引用，帮助企业在数据管理和分析方面实现更高效的工作。

ChatGPT SharePoint 连接器

ChatGPT 通过 SharePoint 连接器，支持公司数据分析与总结。新功能适用于 ChatGPT Plus、Pro 和 Team 用户，帮助跨部门信息整合。数据隐私有保障，ChatGPT 仅访问用户有权限的数据。

新一代开源视觉编码器 OpenVision 发布

加州大学圣克鲁兹分校推出的OpenVision是一个全新的视觉编码器系列，为开发者和企业提供了灵活的选择，旨在提升图像处理和理解的效率。OpenVision不仅支持多种模型和灵活的部署架构，还在多模态基准测试中表现优异。

OpenVision视觉编码器

OpenVision提供26种不同模型，参数规模从590万到6.32亿，适应多种应用场景。灵活的部署架构支持服务器级负载与边缘计算，模型可自适应补丁大小以优化性能。在多模态基准测试中表现优异，采用渐进式训练策略提高训练效率，确保下游性能。

AI 突围

2025年福布斯发布的中国人工智能科技企业TOP50榜单，展现了中国在全球AI领域的崛起。随着市场规模的快速扩张，超过4500家AI企业在智能制造、医疗、自动驾驶等领域实现了规模化应用。尤其是中西部地区企业的崛起，显示出科技创新的突破。11家企业在大模型领域占据主导地位，推动了生成式AI技术的商业化。

中国人工智能科技企业TOP50榜单

中国人工智能企业数量超过4500家，涵盖多个领域，推动行业进步。中西部地区企业入选数量显著增加，显示出科技创新的突破。11家企业在大模型领域占据22%市场份额，推动生成式AI技术商业化。

腾讯混元 T1-Vision 上线元宝

腾讯推出的 “元宝” 工具利用 Hunyuan T1-Vision 模型，能深度理解图片内容，简化信息获取，提高准确性和效率。

腾讯混元 T1-Vision

利用腾讯混元模型，元宝可以识别植物，用户拍照即可获得植物的详细信息。可以进行游戏辅助，翻译游戏界面，帮助理解角色技能。支持图文切换，快速提供决策建议。

总而言之，2025年5月13日，AI领域呈现出百花齐放的态势。无论是国产AI智能体的开放注册，还是全球首款设计Agent的内测，都预示着AI技术正在加速渗透到我们生活的方方面面。而教育部的规范，则为AI在教育领域的健康发展提供了保障。昆仑万维的开源，则为AI技术的创新提供了更多的可能性。这些事件共同构成了AI领域蓬勃发展的生动图景。