Fantasia3D¶

Fantasia3D: Disentangling Geometry and Appearance for High-quality Text-to-3D Content Creation (Chen et al., ICCV 2023)

Overview

Fantasia3D 是较早的高质量 Text-to-3D 方法之一，核心思路是将几何和外观解耦优化：用 DMTet 作为几何表征通过 SDS loss 优化 mesh，再用 PBR 材质模型优化外观。

核心思想¶

DreamFusion 开创了 SDS（Score Distillation Sampling）驱动的 Text-to-3D 范式，但使用 NeRF 表征，输出不是可直接使用的 mesh。Fantasia3D 的改进：

\[ \mathcal{L}_{\text{geo}} = \mathcal{L}_{\text{SDS}}^{\text{normal}} + \lambda_{\text{reg}} \mathcal{L}_{\text{smooth}} \]

\[ \mathcal{L}_{\text{app}} = \mathcal{L}_{\text{SDS}}^{\text{RGB}} \]

Fantasia3D 在当时（2023 年中）的 Text-to-3D 方法中属于较高质量：

方法	输出格式	Mesh 质量	纹理质量	CLIP Score ↑
DreamFusion	NeRF	无直接 mesh	中等	~28
Magic3D	Mesh (DMTet)	较好	较好	~30
Fantasia3D	Mesh (DMTet) + PBR	好	好（PBR）	~29

Fantasia3D 的优势在于 PBR 材质输出，可以在不同光照下重新渲染，而其他方法的纹理通常 baked-in。

Fantasia3D 通过 DMTet + SDS + PBR 材质解耦的方式，实现了文本到高质量可渲染 3D mesh 的生成，是 SDS 驱动 Text-to-3D 路线的代表性工作。