探索视觉奇境:MIT“Meschers”如何解锁2.5D不可能对象的计算与设计新范式?

1

M.C.埃舍尔的艺术作品犹如一扇通往颠覆深度认知的视觉幻境之门。他的画作中充斥着“不可能对象”,这些奇特的几何结构似乎在挑战物理定律的边界,例如,一个看似向上行走的阶梯,在您稍微倾斜头部时,可能瞬间变为向下延伸的路径。这种基于视角变化的感知特性,正是埃舍尔作品的核心魅力所在。

然而,传统的计算机图形科学家和设计师在重现这类视觉错觉时,往往不得不采用变通方案:通过弯曲或切割真实形状,并将其精确地放置在特定角度。这种方法固然能生成表面的视觉效果,但其局限性显而易见。一旦结构的光滑度或光照发生改变,其并非真正光学错觉的本质便会暴露无遗。这意味着,我们无法对这些“模拟错觉”进行精确的几何问题求解,例如计算曲面上的最短路径或模拟热量耗散,因为它们在数学上并不真正成立,仅仅是三维空间中的一种巧妙伪装。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员开发了一种创新性工具——“Meschers”,旨在以更通用、更灵活的方式表示这些“不可能”的对象。Meschers能够将图像和现有的3D模型转换为2.5维结构,从而创建出类似埃舍尔风格的窗户、建筑物乃至甜甜圈等视觉对象。这种独特的处理方法,让用户在保持光学错觉的前提下,得以对这些独特的几何体进行重新打光、平滑处理和深入研究。这不仅仅是对视觉效果的简单复制,更是对不可能对象本质进行计算建模的突破性尝试。

该工具的问世,为几何学研究人员带来了巨大的福音。他们可以利用Meschers计算曲折、不可能表面上两点之间的测地线距离——即蚂蚁在这些曲面上爬行的最短路径。同时,它还能模拟热量如何在这些奇特结构上耗散,这对于理解非传统几何体的物理特性具有重要意义。此外,Meschers也为艺术家和计算机图形科学家提供了全新的创作维度,使他们能够设计出超越物理限制、在多个维度中呈现的视觉作品。

主要作者、麻省理工学院博士生安娜·多迪克(Ana Dodik)的目标是设计不受限于现实复制的计算机图形工具,赋予艺术家独立于物理世界形状可实现性的创作自由。她指出:“通过Meschers,我们为艺术家在计算机上开辟了全新的形状类别。它还有助于感知科学家理解一个对象在何种程度上真正变得‘不可能’。”多迪克及其同事将在八月的SIGGRAPH大会上展示他们的研究论文,这标志着该研究成果正式走向国际学术舞台。

解锁不可能:计算模仿感知错觉的奥秘

“不可能对象”之所以被称为不可能,是因为它们无法在真实三维空间中被完整地实体化。构成这些对象的各个部分在局部上看起来是合理且可实现的,但当试图将它们整体组合时,却无法在三维空间中形成一个全局一致的结构。这种内在的矛盾性正是其“不可能”的根源。

然而,正如CSAIL的研究人员所发现的那样,尽管无法物理复制,但其构成我们感知这些形状的过程却可以被计算模仿。以著名的潘洛斯三角为例,虽然整个对象在物理上是无法存在的——因为它各个部分的深度关系无法“叠加”并形成一个闭合的、真实的形状——但我们仍能识别出其中类似三维L形拐角等现实世界的几何部分。这些较小的区域在三维空间中是可实现的,这被称为“局部一致性”。然而,当我们尝试将这些局部一致的部分组合在一起时,它们无法形成一个全局一致的形状,这就是其矛盾所在。

Meschers方法正是抓住了这一点。它建模的是这些局部一致的区域,而不强迫它们必须全局一致,从而巧妙地拼凑出一个埃舍尔式的结构。在技术层面,Meschers以一种间接的方式来表示不可能对象:它假定我们已知图像中每个像素的x和y坐标,以及相邻像素之间z坐标(深度)的差异。Meschers工具正是利用这些深度差异来推断和构建不可能对象,而非直接构建一个完整的、物理上存在的3D模型。这种巧妙的“2.5维”表示,避开了传统3D建模的束缚,专注于模拟人眼对深度信息的处理方式,从而成功再现了视觉错觉。

Meschers的广泛应用与深远影响

除了渲染不可能对象,Meschers还能将其结构细分为更小的形状,以便进行更精确的几何计算和更精细的平滑操作。这一过程使得研究人员能够消除不可能形状的视觉缺陷,例如他们曾成功地将一个红色心形轮廓的视觉不完美之处进行了优化,使其线条更加流畅自然。

研究人员还在一个名为“不可能的甜甜圈”(impossibagel)的模型上测试了他们的工具,这个甜甜圈以一种物理上不可能的方式进行了阴影处理。Meschers协助多迪克及其同事模拟了热量在模型上的扩散过程,并计算了模型不同点之间的测地线距离。多迪克解释说:“想象你是一只蚂蚁,正在这个甜甜圈上爬行,你想要知道需要多长时间才能穿过它。同样地,我们的工具可以帮助数学家近距离分析不可能形状的底层几何结构,就像我们研究现实世界中的物体一样。”这展示了Meschers在纯粹数学研究领域的巨大潜力。

Meschers工具就像一位魔法师,能够将普通对象转化为令人惊叹的光学错觉,这极大地方便了计算机图形艺术家创作出超越现实的“不可能对象”。它还可以利用“逆向渲染”工具,将不可能对象的图纸和图像转换为高维度的设计,这意味着艺术家只需绘制草图,Meschers就能将其转化为可编辑、可研究的数字模型。

资深作者、电气工程与计算机科学副教授、CSAIL几何数据处理小组负责人贾斯汀·所罗门(Justin Solomon)表示:“Meschers表明,计算机图形工具不必受物理现实规则的束缚。令人难以置信的是,艺术家们使用Meschers可以对我们在现实世界中永远找不到的形状进行推理和创作。”这不仅拓宽了数字艺术的边界,也为我们理解和模拟非传统空间提供了新的视角。

Meschers还能够辅助计算机图形艺术家调整其作品的阴影效果,同时完美地保留光学错觉。这种多功能性使得创作者能够改变艺术作品的光照,以描绘更多样化的场景(例如日出或日落),Meschers通过重新打光一个滑板上的狗的模型,有力地证明了这一点。这种能力对于电影制作、游戏设计和虚拟现实体验而言,具有颠覆性的意义,因为它允许创作者在不牺牲视觉奇观的前提下,实现更丰富的叙事和情感表达。

尽管Meschers已展现出非凡的通用性,但对于多迪克及其同事而言,这仅仅是开始。团队正在考虑设计一个更易于使用的界面,同时构建更复杂的场景。他们还在与感知科学家合作,探索这款计算机图形工具更广泛的应用前景。这项研究不仅推动了计算机图形学的发展,也为认知科学、数学乃至哲学领域提供了新的研究工具和思考维度。Meschers的未来充满无限可能,它有望继续在数字世界中,为我们揭示更多超越现实的奥秘。