跳转至

ShapeFusion

ShapeFusion: A 3D diffusion model for localized shape editing

Overview

ShapeFusion 关注的是顶点空间里的局部形变。它不依赖额外的 3D 潜表示,而是直接在 mesh 顶点坐标上做局部扩散编辑,并通过 mask 训练保证未编辑区域尽量不动。


核心问题

传统 3DMM / PCA 这类参数模型更擅长全局变化,但不适合精确、局部、可解释的区域编辑:

  • latent 空间通常是纠缠的
  • 局部调一个区域,别处也会跟着动
  • 很难做到“只改这里”

ShapeFusion 的目标是:

允许用户指定任意局部区域和控制点,在 3D mesh 上做完全局部的扩散编辑。


方法框架

1. Masked diffusion training

  • 训练时只给 mesh 的一部分区域加噪
  • mask 由随机 anchor point 的 geodesic 邻域定义
  • 未被 mask 的区域保持不变

这样做的直接效果是:模型从训练方式上就学会“局部改、其余保留”。

2. 顶点级 denoising

  • 去噪器直接在 3D 顶点空间中工作
  • 目标是恢复被扰动区域的几何
  • 同时保住未被扰动区域的结构

3. Mesh-aware denoiser

  • 用 vertex-index positional encoding 让每个顶点有稳定身份
  • 用分层 mesh convolution 传播局部与远距离信息
  • 让编辑区域与未编辑区域边界更平滑

论文这里的重点在于让 denoiser 本身真正理解 mesh 拓扑,而不是继续堆更强的 latent。


它能做什么

ShapeFusion 支持两类典型操作:

  • localized manipulation:对选中区域做可控形变
  • region sampling:在指定局部采样新的部件或表情

用户不需要被限制在固定的人脸部件或少量预定义控制点上,而是可以自己定义区域。


为什么它重要

ShapeFusion 的意义主要有两点:

  • 它把局部编辑问题从 latent disentanglement 转成了 masked diffusion inpainting
  • 它说明“局部编辑”可以直接在 mesh 顶点空间里通过扩散过程完成

这和后来的原生 3D latent 编辑路线不同,但它在“局部保留 + 局部变化”这个问题上给出了很干净的形式化方式。


论文里值得记住的点

  • 方法支持任意自定义区域,不依赖固定语义部件
  • 通过顶点索引编码和分层 mesh convolution,局部编辑不会轻易破坏整体拓扑结构
  • 相比基于优化或 latent disentanglement 的方法,它更直接,也更容易解释编辑范围

局限

  • 论文主要在人脸和人体参数化 mesh 上验证,开放域通用 mesh 场景不是重点
  • 依赖固定 mesh 拓扑,泛化到拓扑差异很大的对象并不自然
  • 更适合几何变形,不涉及高质量纹理或完整资产编辑流程

一句话总结

ShapeFusion 的主要价值,是把局部 3D mesh 编辑建模为一个 masked diffusion inpainting 问题,在顶点空间里直接做到“只改局部、其余保留”。

评论

评论功能当前未启用。当前站点不依赖 GitHub 评论服务;如果后续需要评论,建议接入自托管评论后端。
回到页面顶部