AI日报：GPT-4.1上线，通义万相开源，可灵视频占比30%

在人工智能领域，每天都有新的突破和创新涌现。2025年5月15日，AI领域又迎来了一系列令人瞩目的进展。本文将深入探讨GPT-4.1的正式上线、阿里通义万相Wan2.1-VACE的开源、可灵大模型在视频生成领域的市场份额，以及其他重要的AI动态，带您全面了解AI技术的最新趋势和应用。

GPT-4.1：编码能力的飞跃

OpenAI正式发布了GPT-4.1及其轻量级版本GPT-4.1mini，这标志着在人工智能编码能力上的一次重大升级。GPT-4.1在处理复杂编程需求时表现出更高的效率和更快的运行速度，使其成为开发者和需要处理复杂指令场景的理想选择。其轻量级版本GPT-4.1mini，则在资源受限的设备上也能流畅运行，为更广泛的用户提供了访问AI技术的渠道。

本次升级还优化了用户体验，ChatGPT新增了长按复制、表格复制和流式传输等功能，用户界面也得到了显著提升，使得用户在使用过程中更加便捷。

GPT-4.1的推出，不仅提升了编码效率，还降低了AI技术的使用门槛，预示着AI将在软件开发、数据分析等领域发挥更大的作用。未来，我们可以期待GPT-4.1在更多行业和场景中的应用，为各行各业带来效率的提升和创新。

阿里通义万相Wan2.1-VACE：视频编辑的革新

阿里通义万相宣布VACE开源，这是一个支持多种分辨率和任务的视频编辑统一模型，旨在提供一站式的视频创作体验。VACE通过多模态输入机制，实现了高效灵活的视频编辑，支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务，极大地提高了视频创作的效率。

VACE还具备强大的可控重绘能力，可以基于人体姿态、运动光流等控制生成，支持主体和背景参考。其提出的视频条件单元VCU，统一了多模态输入，实现了多任务的自由组合与灵活编辑。

通义万相Wan2.1-VACE的开源，为视频创作领域带来了新的可能性。它降低了视频编辑的技术门槛，让更多的人可以参与到视频创作中来。未来，我们可以期待VACE在短视频、广告、教育等领域得到广泛应用。

可灵大模型：视频生成领域的领跑者

Poe发布的2025年春季AI模型使用趋势报告显示，中国快手的可灵多款视频生成模型在文生视频领域表现突出，市场份额达到了30%，领先于Runway等竞争者。其中，可灵2.0模型在发布后仅三周就占据了21%的使用比例。自去年6月发布以来，可灵AI的全球用户突破2200万，月活跃用户增长了25倍，生成的视频和图片数量显著增加。

可灵大模型的成功，表明中国在人工智能视频生成领域取得了显著进展。其强大的生成能力和用户规模，预示着AI将在视频创作领域发挥越来越重要的作用。未来，我们可以期待可灵AI在电影、游戏、广告等领域带来更多的创新应用。

Stability AI：轻量级语音合成的突破

Stability AI发布了一款名为“Adversarial Post-Training加速的快速文字转音频生成”的超轻量文字转语音模型，参数仅为341M。该模型在H100GPU上只需75毫秒即可生成12秒音频，在手机CPU上只需7秒即可完成同样任务，性能强大且多样性强。

ARC后训练方法不基于蒸馏，提升了模型生成速度与质量。该模型轻量化的设计，支持手机本地运行，大幅提升了移动端创意应用体验。此外，该模型还支持音频转音频功能，可以实现风格迁移，激发更多的创作灵感。

Stability AI的这一突破，为语音合成领域带来了新的发展机遇。其轻量级的模型设计，使得AI语音合成技术可以在移动设备上得到广泛应用。未来，我们可以期待这一技术在语音助手、智能家居、教育等领域发挥更大的作用。

微软 WizardLM 团队加入腾讯：大模型领域的强强联合

微软的人工智能研究团队WizardLM整体加入了腾讯AI实验室的“混元”团队，标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破，还通过开源模型展示了其研发实力。

Hunyuan-TurboS0416模型首次使用“混元”命名，象征着团队与腾讯的深度融合。腾讯计划大幅增加AI投资，目标是在全球AI竞争中占据更为主导的地位。

微软 WizardLM 团队加入腾讯，是人工智能领域的一次重要合作。双方在技术和资源上的互补，将有助于推动大模型技术的发展。未来，我们可以期待腾讯在AI领域取得更大的突破。

腾讯混元图像2.0：AI视觉的新篇章

腾讯混元大模型团队宣布，混元图像2.0将在5月16日发布，这是腾讯在AI视觉领域的重要突破，以“更智能、更开放、更中国”为核心理念。

混元图像2.0的发布，标志着腾讯在AI视觉领域又向前迈进了一步。新工具强调“更智能、更开放、更中国”，将助力创作者和企业迈向AI驱动的视觉生产新时代。继去年混元大模型升级后，腾讯再次展示了其在人工智能领域的持续创新力。

上海启动人工智能标识生态联盟：构建可信的AI环境

上海市成立了人工智能标识生态联盟，旨在推动人工智能领域的标识技术发展，提高生成内容的透明度和安全性。该联盟通过政策解读和企业合作，为构建可信的人工智能环境奠定基础。

联盟由上海市委网信办指导，汇聚了多家知名企业，目标是提升AI生成内容的透明度和安全性。国家互联网应急中心和中国电子技术标准化研究院解读了相关政策，强调了国际规则与中国特色的结合。小红书、MiniMax等企业参与了标识工作实践，探索多种内容的标识方案并积累治理经验。

人工智能标识生态联盟的成立，是构建可信AI环境的重要举措。通过制定统一的标识标准，可以有效提升AI生成内容的透明度和安全性，为用户提供更加可靠的信息。

Lightricks发布LTX-Video-13B：高清AI视频的飞跃

以色列科技公司Lightricks发布了开源AI视频生成模型LTX-Video-13B精炼模型，以130亿参数为基础，结合多尺度渲染技术和高效量化优化，将视频生成速度提升至10秒以内，同时保持高质量输出。

LTX-Video-13B采用多尺度渲染技术，可以在10秒内生成高清视频，速度提升5倍以上。该模型是开源的，支持低显存设备运行，降低了AI视频制作成本。其生成速度提升30倍，媲美专业影视作品，有望重塑内容创作生态。

谷歌AlphaEvolve：AI自进化的突破

谷歌DeepMind发布了AlphaEvolve，这是一款结合Gemini大语言模型与进化算法的AI编码代理。它在多个领域展现了强大的自优化能力，包括数据中心调度、芯片设计、AI训练以及数学研究。

AlphaEvolve优化了数据中心调度，回收了0.7%的全球算力，节省了运营成本。在AI训练方面，Gemini模型训练速度提升了32.5%，展现了强大的自我优化能力。AlphaEvolve的成功，表明AI在自我优化方面取得了显著进展。未来，我们可以期待AI在更多领域实现自我优化，为人类带来更多的便利。

腾讯元宝浏览器插件：提升网页浏览效率

腾讯元宝浏览器插件尝鲜版上线Chrome平台，提供悬浮球、常驻侧边栏和划词工具栏等功能，旨在提升网页浏览与信息处理效率。

悬浮球功能支持一键翻译和总结网页内容，可以轻松跨越语言障碍并节省阅读时间。常驻侧边栏可以高效答疑，支持截图提问，大幅提升信息获取效率。划词工具栏可以实现选中文本后的即时搜索或翻译，让信息处理更流畅。

腾讯元宝浏览器插件的推出，为用户提供了更加便捷的网页浏览体验。其强大的功能和简洁的设计，有望成为用户提升效率的得力助手。

2025年5月15日，AI领域呈现出蓬勃发展的态势。从GPT-4.1的编码能力飞跃，到阿里通义万相Wan2.1-VACE的视频编辑革新，再到可灵大模型在视频生成领域的领先地位，以及Stability AI的轻量级语音合成突破、微软 WizardLM 团队加入腾讯、腾讯混元图像2.0的发布、上海启动人工智能标识生态联盟、Lightricks发布LTX-Video-13B、谷歌AlphaEvolve的AI自进化突破，以及腾讯元宝浏览器插件的推出，每一个进展都为人工智能的未来发展注入了新的活力。未来，我们可以期待AI在更多领域实现创新应用，为人类社会带来更大的福祉。