跳转至

AnchorFlow

AnchorFlow: Training-Free 3D Editing via Latent Anchor-Aligned Flows

Overview

AnchorFlow 的核心观点是:训练自由的 3D 编辑之所以常常编辑不够或几何不稳,原因不只在 guidance 弱,更在于每个 timestep 使用的 latent anchor 不一致,导致编辑方向在扩散过程中不断漂移。


核心问题

很多 inversion-free 3D 编辑方法隐式依赖每个 timestep 的随机噪声作为 anchor:

  • anchor 不稳定,flow 方向会漂
  • 漂了以后,语义改动会互相抵消
  • 最终要么改得不够,要么几何坏掉

AnchorFlow 要解决的是:

在 training-free 的前提下,为 source 和 target trajectory 建立一个更稳定的共享 latent anchor。


方法框架

1. Global latent anchor

  • 不再把每个 timestep 的随机噪声当作独立 anchor
  • 而是让 source / target trajectory 共享更稳定的全局 latent reference

2. Anchor-alignment loss

  • 用一个 relaxed 的对齐目标,让两条 trajectory 的单步 inversion 保持接近
  • 重点是给可编辑性和稳定性之间留出平衡空间,而不是完全强绑死

3. Anchor-aligned update rule

  • 在编辑过程中按对齐后的 flow 方向逐步更新
  • 保证语义编辑足够强,同时尽量保住几何结构

它支持哪些编辑

论文里覆盖了几类常见 3D 编辑:

  • action change
  • object addition
  • object replacement
  • style change

并且方法是 mask-free 的,不依赖额外编辑掩码。


关键实验结论

Eval3DEdit 基准

AnchorFlow 在 Eval3DEdit 上取得了最好的一组综合结果:

  • Overall CLIP_img = 0.7173
  • Overall CLIP_txt = 0.4866

相较 inversion-free editing,平均提升约:

  • CLIP_img +0.0067
  • CLIP_txt +0.0161

这说明它在 identity preservation 和 semantic modification 之间取得了更好的平衡。

定性结果

  • 相比 direct editing,它保留 identity 更好
  • 相比 inversion-free editing,它更少出现 under-editing 和局部几何破坏
  • 对 rigid 和 non-rigid 编辑都能工作

参数分析

论文也明确指出:

  • 编辑步数和编辑强度越大,语义变化更强
  • 但 identity preservation 会相应下降
  • AnchorFlow 提供的是更稳定的可调平衡,而不是完全免调参

为什么它重要

AnchorFlow 的主要贡献不在表示,而在训练自由编辑算法本身:

  • 它把问题从“怎么加更强 guidance”转成“怎么稳定 latent anchor”
  • 给 inversion-free / flow-based 编辑提供了更清晰的解释框架

这对后续很多 training-free 3D editing 都有参考价值。


局限

  • 虽然是 mask-free,但仍然属于训练自由编辑,结果依赖底层 flow model 本身能力
  • 参数选择仍会影响编辑强度和保留度的平衡
  • 论文主要关注编辑算法,不解决底层 3D 生成骨干的表示局限

一句话总结

AnchorFlow 的主要价值,是通过 latent anchor consistency 稳定 training-free 3D 编辑过程,让语义修改更充分,同时减少几何失真和 under-editing。

评论

评论功能当前未启用。当前站点不依赖 GitHub 评论服务;如果后续需要评论,建议接入自托管评论后端。
回到页面顶部