AI前沿洞察:Coze开源、灵犀发布及3D模型新纪元

1

在人工智能领域日新月异的今天,各类创新技术与应用层出不穷。本文将深入探讨近期涌现的几项重要进展,包括字节跳动开源Coze平台、可灵AI的创新、Runway的视频编辑模型、金山办公的WPS AI 3.0、京东的JoyAI品牌升级、浦东人工智能种子基金、阿里巴巴的WebSailor AI Agent、中国大模型数量的突破、蚂蚁数科的Finova评测基准以及腾讯的混元3D世界模型。这些进展不仅展示了人工智能技术的强大潜力,也预示着未来科技发展的方向。

字节跳动开源Coze平台

字节跳动近日宣布将其AI Agent开发平台Coze的核心项目Coze Studio和Coze Loop开源。Coze Studio是一个可视化AI Agent开发平台,通过拖拽式工作流构建,极大地简化了AI应用的开发和部署过程。Coze Loop则专注于AI Agent全生命周期管理,涵盖提示词调试、性能评估等关键功能,旨在优化智能体的表现。这两个项目均采用Apache 2.0协议,允许开发者自由使用、修改甚至商业化部署,从而显著降低了AI技术的应用门槛。这一举措不仅体现了字节跳动在AI领域的战略布局,也为整个行业注入了新的活力。

image.png

可灵AI的创新

可灵AI在2025世界人工智能大会上推出了全新创意工作台“灵动画布”,并对“多图参考”功能进行了重大升级。灵动画布提供无限可视化空间、智能创作辅助和多人实时协作功能,旨在提升创作效率。升级后的多图参考功能在角色一致性、场景统一性和画风保持能力上有了显著提升。值得一提的是,可灵AI的全球创作者数量已突破4500万,覆盖全球149个国家和地区,B端客户增长迅速,这充分显示出AI生成内容的广泛应用和市场认可度的提升。可灵AI的创新无疑为内容创作领域带来了新的可能性。

6388929907016861771097360.jpg

Runway推出全新视频编辑模型Aleph

Runway公司推出了全新的视频编辑模型Aleph,被誉为“视频领域的Kontext模型”。该模型通过自然语言指令实现视频的多样化编辑,包括内容增删、风格迁移、绿幕抠像等,极大降低了视频创作门槛,为内容创作者提供了前所未有的自由度。Aleph模型支持自然语言指令对视频进行多样化编辑,如增删内容和风格迁移,还能实现环境与氛围变换,例如将晴天场景变为雨天或调整为夜景。此外,Aleph还内置绿幕抠像功能并支持重新打光,从而显著提升后期制作效率。Runway的Aleph模型无疑将革新视频编辑领域。

金山办公发布WPS AI 3.0灵犀版本

金山办公在2025AI生产力论坛上正式发布WPS AI 3.0版本——WPS灵犀,标志着办公AI从工具升级为智能助理。该版本采用原生Office智能体设计,支持自然语言多轮对话,实现文档创作、演示文稿生成及语音助手等功能。WPS灵犀不仅支持多轮对话,实现文档创作与演示文稿生成的无缝交互,还能保留原有格式,确保AI生成内容符合用户实际需求。此外,WPS知识库与AI搜索功能的集成,为用户提供了全面的智能办公解决方案。

image.png

京东升级大模型品牌为JoyAI

京东在2025世界人工智能大会上宣布升级大模型品牌为JoyAI,并推出全新智能品牌JoyInside,展示了其在人工智能领域的强大实力与创新能力。JoyAI大模型系列覆盖多种模态,旨在满足不同用户的需求,并引入创新技术以提升推理效率和降低训练成本。JoyInside应用广泛,涵盖人形机器人、儿童玩具等多种载体,充分展示了京东在AI技术应用方面的多元化探索。

浦东发布20亿元人工智能种子基金

浦东发布20亿元人工智能种子基金,首期5亿专注早期投资,旨在破解初创企业融资难题,推动人工智能产业发展。该基金总规模20亿元,首期5亿元,专注种子轮投资,充分体现了浦东对人工智能产业的高度重视和大力支持。目前,浦东AI产业规模已超1600亿元,占全市40%,形成显著的集群效应。浦东还推出了五大举措推动AI新生态,包括场景拓展、基础设施、金融支撑等,为人工智能企业的发展提供了全方位的支持。

阿里巴巴开源WebSailor AI Agent

阿里巴巴通义实验室推出了开源AI智能体框架WebSailor,该框架在复杂任务处理上表现出色,并通过强化学习和复杂任务生成技术提升了信息检索的效率。WebSailor是一个专注于复杂任务处理的开源AI智能体框架,通过强化学习与复杂任务生成相结合,显著提升了模型性能。此外,WebSailor还采用了信息模糊化技术,增强了任务的挑战性,从而提高了模型智能水平。阿里巴巴开源WebSailor AI Agent,打破了信息检索的壁垒,为开发者提供了更多探索空间。

image.png

中国大模型数量突破1500

中国在人工智能领域取得了显著成就,尤其是在大模型数量方面。全球大模型数量已达3755个,中国企业贡献了1509个,领先世界。生成式人工智能产品用户比例高达80.9%,行业规模持续增长。同时,优质国产人工智能产品加速出海,我国国际影响力显著提升。中国在大模型领域的突破,不仅提升了国内人工智能产业的竞争力,也为全球人工智能发展贡献了重要力量。

蚂蚁数科发布Finova大模型金融应用评测基准

蚂蚁数科在世界人工智能大会论坛上正式发布了金融推理大模型Agentar-Fin-R1,该模型在金融专业性、推理能力及安全合规方面表现出色。Agentar-Fin-R1在金融领域表现卓越,超越同类模型,这得益于蚂蚁数科构建的全面金融任务分类体系,覆盖多个金融场景。此外,Finova评测基准的开源,将助力行业提升大模型应用水平,推动金融行业的智能化转型。

腾讯发布混元3D世界模型

腾讯在2025世界人工智能大会上发布了混元3D世界模型1.0,并全面开源。该模型支持高精度360°场景生成和可交互漫游功能,极大降低了3D内容创作门槛,为游戏开发、VR、数字内容创作等领域带来新的可能性。混元3D世界模型具备高精度360°场景生成能力,显著提升了视觉体验,并支持可交互漫游场景,通过智能范围判断优化体验。腾讯的全面开源,将赋能全球开发者社区,共同推动3D内容创作的发展。

总结

从字节跳动开源Coze平台到腾讯发布混元3D世界模型,再到中国大模型数量的突破,这一系列进展充分展示了人工智能技术的蓬勃发展和广泛应用前景。随着技术的不断创新和应用场景的不断拓展,人工智能将在未来发挥更加重要的作用,为各行各业带来深刻的变革。