在3D角色动画的制作领域,自动绑定技术一直是一个重要的研究方向。近日,阿里巴巴高德地图团队推出了一项名为“HumanRig”的创新项目,旨在通过大规模、高质量的数据集和创新的自动绑定框架,推动3D角色动画制作的自动化发展。该项目不仅提供了一个包含11434个T姿态网格的大型数据集,还提出了一个先验引导骨架估计器(PGSE)和网格-骨架互注意网络(MSMAN)的自动绑定框架,为游戏开发、影视制作、虚拟现实等多个领域带来了新的可能性。
HumanRig:3D角色自动绑定的新突破
HumanRig的出现,旨在解决当前绑定技术因缺乏高质量数据集而发展受限的问题。现有数据集在规模、多样性和骨骼一致性方面存在不足,限制了自动绑定技术的发展。为了解决这一问题,阿里巴巴团队构建了一个包含11434个高质量AI生成人形网格的大规模数据集。这些模型均以T-pose呈现,并严格遵循行业标准的骨架拓扑结构,可以直接应用于主流动画引擎。
HumanRig数据集的多样性体现在其涵盖了从真实人物到卡通角色,甚至拟人化动物的广泛角色类型。这种多样性使得该数据集能够满足不同应用场景的需求,为自动绑定技术的发展提供了坚实的基础。
HumanRig的主要功能
HumanRig项目不仅仅是一个数据集,更包含了一整套自动绑定解决方案。其主要功能包括:
- 大规模高质量数据集:HumanRig数据集是首个专为3D人形角色自动绑定任务设计的大规模数据集,包含11,434个高质量的AI生成人形网格。
- 先验引导骨架估计器(PGSE):PGSE模块利用2D先验信息投射到3D空间,初始化粗略骨架,从而大幅降低绑定任务的复杂度。这种方法能够有效地减少搜索空间,提高绑定效率。
- U形Point Transformer网格编码器:传统的网格编码器通常依赖于3D网格的边信息,但在复杂网格上,这些边信息可能会引入噪声。HumanRig项目采用U形Point Transformer作为网格编码器,摒弃了对3D网格的边信息的依赖,从而增强了复杂网格上的绑定鲁棒性。
- 网格-骨架互注意力网络(MSMAN):MSMAN模块通过在高级语义空间中融合网格与骨架特征,实现了骨架构建与蒙皮的联合优化。这种方法能够更好地捕捉网格和骨架之间的关系,从而生成更自然、更逼真的绑定效果。
HumanRig的技术原理
HumanRig项目的技术原理主要包括数据集构建和自动绑定流程两个方面:
HumanRig数据集构建:
- 生成多样化2D图像:HumanRig数据集的构建首先从生成多样化的2D图像开始。通过AI驱动的2D图像生成技术,从文本描述中生成各种各样的T-pose角色图像。这些图像涵盖了不同的种族、性别、年龄、体型和服装风格,为后续的3D网格生成提供了丰富的基础。
- 生成高质量3D网格:接下来,利用InstantMesh和Unique3D等工具,将2D图像转换为高质量的3D网格。这些工具能够根据2D图像中的信息,自动生成具有合理拓扑结构和细节的3D模型。为了保证网格的质量,还需要进行手动调整和优化。
- 筛选与优化:从17,268个初始网格中筛选出14,662个高质量模型,并使用Mixamo半自动化工具进行骨骼绑定,最终形成11,434个高质量绑定模型。这个过程需要专业人员的参与,以确保骨骼的正确放置和蒙皮权重的合理分配。
自动绑定流程:
- 骨架初始化:自动绑定流程的第一步是通过PGSE模块生成粗略骨架。PGSE模块利用2D先验信息,例如人体关键点的检测结果,来初始化3D骨架的位置和方向。这种方法能够有效地减少搜索空间,提高骨架估计的准确性。
- 特征提取:接下来,分别使用基于MLP的骨架编码器和U形Point Transformer提取骨架和网格特征。骨架编码器将骨架的关键点坐标转换为高维特征向量,而U形Point Transformer则将网格的顶点坐标和法线信息转换为高维特征向量。这些特征向量包含了骨架和网格的几何信息和语义信息。
- 特征融合与优化:然后,通过MSMAN模块融合骨架和网格特征,实现从粗到细的骨架关节回归和蒙皮权重估计。MSMAN模块利用注意力机制,学习骨架和网格特征之间的相关性,从而更好地预测骨骼的位置和蒙皮权重。为了进一步提高绑定效果,还可以采用迭代优化算法,不断调整骨骼的位置和蒙皮权重,直到达到满意的效果。
- 生成动画角色:最后,将优化后的骨架和蒙皮权重结合,生成可用于动画制作的角色。这些角色可以直接导入到主流的动画引擎中,进行动画制作和渲染。
HumanRig的应用场景
HumanRig的自动绑定技术在多个领域都有广泛的应用前景:
- 游戏开发:在游戏开发中,角色动画的制作是一个耗时且费力的过程。HumanRig的自动绑定技术可以大幅减少角色动画制作的时间和成本,尤其在处理复杂角色模型(如带有复杂衣物或配件的角色)时表现出色。游戏开发者可以利用HumanRig快速生成高质量的角色绑定,从而将更多的时间和精力投入到游戏的其他方面。
- 影视制作:在影视行业,角色动画同样扮演着重要的角色。HumanRig的自动绑定技术能快速生成高质量的角色绑定,显著提升制作效率。电影制作人员可以利用HumanRig快速创建各种各样的角色,并赋予它们逼真的动作和表情,从而为观众带来更加沉浸式的观影体验。
- 虚拟现实(VR)和增强现实(AR):在虚拟现实和增强现实应用中,实时交互的角色动画是提升沉浸感的关键。HumanRig的自动绑定技术能为虚拟角色提供实时的骨骼动画支持,确保角色动作的自然性和流畅性。用户可以通过VR/AR设备与虚拟角色进行互动,从而获得更加真实的体验。
- 3D数字人:高德地图可以利用自动绑定技术,快速生成个性化3D数字人,为用户提供更具互动性和趣味性的导航体验。用户可以根据自己的喜好定制数字人的外观和声音,并让数字人在导航过程中提供语音提示和视觉引导。
总结与展望
HumanRig项目的推出,为3D角色动画制作领域带来了新的希望。通过提供大规模、高质量的数据集和创新的自动绑定框架,HumanRig有望推动3D角色动画制作的自动化发展,并为游戏开发、影视制作、虚拟现实等多个领域带来新的可能性。随着技术的不断进步,我们有理由相信,未来的3D角色动画制作将会更加高效、便捷和智能化。
HumanRig的开源,无疑将加速该技术在各个领域的应用和发展。期待未来能看到更多基于HumanRig的创新应用,为用户带来更加丰富多彩的体验。