阿里巴巴近日宣布推出新一代万相2.6系列模型,这一针对专业影视制作和图像创作场景进行全面升级的产品,被誉为'全球功能最全的视频生成模型'。随着万相2.6在阿里云百炼和万相官网的同步上线,中国AI视频生成领域迎来了又一重大突破。
核心技术升级与功能突破
万相2.6系列模型在多个关键技术维度实现了显著提升,特别是在角色扮演功能、分镜控制和视频时长方面取得了突破性进展。这些升级不仅满足了专业创作者的需求,也为普通用户提供了更强大的创作工具。
角色扮演功能:国内首创的视觉一致性技术
作为国内首个支持'角色扮演'功能的视频模型,万相2.6能够精准捕捉并复现输入视频中的角色特征。这一功能允许用户参考已有视频中的角色外观和音色,按照提示词生成单人、多人甚至人与物合拍的视频内容。
在技术实现上,通义万相集成了多项创新技术,对参考视频进行多模态联合建模与学习。系统能够提取主体的情绪、姿态、视觉特征以及音色、语速等声学特征,确保在全感官维度上保持高度一致性。这种技术的突破使得角色在不同场景、不同动作中能够保持稳定的视觉和听觉特征,为影视创作提供了前所未有的便利。
专业级分镜控制:从简单提示到专业叙事
万相2.6新增的分镜控制功能是其另一大亮点。该功能能够将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频。通过高层语义理解,模型能够构建具备完整故事线和叙事张力的专业级多镜头段落。
在镜头切换过程中,万相2.6能够保持核心主体、场景布局和环境氛围的高度一致性,实现了电影级的运镜效果。这一功能对于广告设计、短剧制作等专业场景具有重要意义,大大降低了专业视频制作的门槛。
视频时长与画质的双重突破
此次升级将单次视频时长提升至国内最高的15秒,为用户提供更丰富的创作空间。同时,在画质、音效、指令遵循等方面也进行了全面优化,使得生成的内容更加接近专业水准。
全面的视觉创作能力矩阵
万相2.6系列模型已经形成了完整的视觉创作能力矩阵,支持包括文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力。这种全方位的创作工具集,使得用户可以根据不同需求选择最适合的创作方式。
实际应用场景与价值
个人创作:圆普通用户的电影梦
万相2.6的角色扮演和分镜控制功能极大地降低了专业视频制作的门槛。例如,普通用户只需上传一段个人视频,输入科幻悬疑风格的提示词,系统就能在几分钟内完成分镜设计、角色演绎、画面配音等工作,生成一段镜头叙事完整、电影级运镜的短片。
这种技术突破让普通用户也能体验专业级的视频创作过程,实现了'人人都是导演'的可能性。无论是个人纪念视频的创意呈现,还是社交媒体上的个性化内容创作,万相2.6都能提供强大的技术支持。
专业场景:提升影视制作效率
在专业影视制作领域,万相2.6同样展现出巨大价值。通过输入连续提示词,模型可以生成一段完整叙事的短片,大幅提升了前期创意验证和分镜设计的效率。这一功能特别适合广告制作、短剧开发等需要快速产出内容的场景。
对于专业影视团队而言,万相2.6可以作为一个强大的辅助工具,帮助导演和制片人快速可视化创意构想,降低试错成本,提高制作效率。同时,角色扮演功能也为角色设计、动作捕捉等工作提供了新的可能性。
企业应用:API赋能更多行业
企业用户可以通过阿里云百炼调用万相2.6的API,将这一先进技术集成到自身的业务系统中。这种开放性使得万相2.6的能力可以广泛应用于教育、娱乐、广告、媒体等多个领域,为各行业的数字化转型提供技术支持。
行业地位与未来展望
阿里巴巴在AI视频生成领域的布局始于今年9月,当时率先在国内发布音画同步的视频生成模型万相2.5。在权威大模型评测集LMArena上,万相图生视频位居国内第一。此次2.6版本的发布,进一步巩固了阿里在国内视频生成领域的领先地位。
据悉,千问APP也将于近期上线万相2.6模型,并提供更丰富的玩法。这一布局将使阿里能够通过多渠道触达不同类型的用户,扩大技术影响力。
万相2.6的推出不仅代表了阿里在AI视频生成技术上的突破,也反映了中国企业在全球AI竞争中的实力。随着技术的不断迭代和应用的深入拓展,我们有理由相信,以万相为代表的AI视频生成技术将在未来几年内继续推动影视创作和数字内容产业的变革。
技术创新背后的挑战与思考
尽管万相2.6在功能上取得了显著突破,但AI视频生成技术仍面临诸多挑战。如何在保持生成质量的同时提高生成效率,如何更好地理解用户意图并生成符合预期的内容,如何处理版权和伦理问题等,都是行业需要共同面对的课题。
阿里万相团队表示,未来将继续优化模型性能,拓展应用场景,并加强与行业伙伴的合作,共同推动AI视频生成技术的发展。这种开放协作的态度,将有助于整个行业形成良性发展的生态。
结语
阿里万相2.6的发布标志着中国AI视频生成技术迈入新阶段。通过角色扮演、多分镜控制等创新功能,万相2.6不仅满足了专业创作者的需求,也为普通用户打开了创意表达的新途径。随着技术的不断进步和应用场景的拓展,我们有理由期待AI视频生成技术在未来的更多可能性,以及它将为数字内容产业带来的深远影响。


