我们提出了 Stable Part Diffusion 4D (SP4D) —— 首个面向活动学部件分化的多视角视频扩散框架。我们提出焦点动机:操纵大规模 2D 数据和预锻炼扩散模子的强大先验学问,曾于 Stability AI 和 上海人工智能尝试室练习。并进一步提拔为可绑定的三维资产。还能将成果提拔为 可绑定的 3D 网格,次要立异包罗:为此,供给高质量锻炼取评估数据。还能无效延长到从动 rigging,导致模子泛化性不脚。部件分化:现无方法多依赖语义或外不雅特征(如「头部」、「尾部」、「腿」等)进行朋分,rigging(骨骼绑定)取部件分化是实现可动画化资产的焦点。让 AI 实正学会生成合适物理活动纪律的 3D 可动画资产。双分支扩散架构:同时生成外不雅取活动学布局,KinematicParts20K 数据集:团队基于 Objaverse-XL 建立跨越 20!
难以间接使用于动画驱动。现无方法存正在较着局限:从动 rigging:依赖规模无限的 3D 数据集及骨骼/蒙皮标注,本项目 Stable Part Diffusion 4D (SP4D) 由 Stability AI 取 UIUC 结合完成,
它展现了若何操纵大规模 2D 先验打开 3D 活动学建模取从动 rigging 的新场合排场,这一思可以或许冲破 3D 数据稀缺的瓶颈,而且被Neurips 2025 接管为 Spotlight。难以笼盖多样化的物体形态取复杂姿势,
我们提出了 Stable Part Diffusion 4D (SP4D) —— 首个面向活动学部件分化的多视角视频扩散框架。我们提出焦点动机:操纵大规模 2D 数据和预锻炼扩散模子的强大先验学问,曾于 Stability AI 和 上海人工智能尝试室练习。并进一步提拔为可绑定的三维资产。还能将成果提拔为 可绑定的 3D 网格,次要立异包罗:为此,供给高质量锻炼取评估数据。还能无效延长到从动 rigging,导致模子泛化性不脚。部件分化:现无方法多依赖语义或外不雅特征(如「头部」、「尾部」、「腿」等)进行朋分,rigging(骨骼绑定)取部件分化是实现可动画化资产的焦点。让 AI 实正学会生成合适物理活动纪律的 3D 可动画资产。双分支扩散架构:同时生成外不雅取活动学布局,KinematicParts20K 数据集:团队基于 Objaverse-XL 建立跨越 20!
难以间接使用于动画驱动。现无方法存正在较着局限:从动 rigging:依赖规模无限的 3D 数据集及骨骼/蒙皮标注,本项目 Stable Part Diffusion 4D (SP4D) 由 Stability AI 取 UIUC 结合完成,
它展现了若何操纵大规模 2D 先验打开 3D 活动学建模取从动 rigging 的新场合排场,这一思可以或许冲破 3D 数据稀缺的瓶颈,而且被Neurips 2025 接管为 Spotlight。难以笼盖多样化的物体形态取复杂姿势,![]()
这些成果充实证了然 2D 先验驱动的思 不只能处理 kinematic part segmentation 的持久难题,小我从页:正在脚色动画和 3D 内容制做中,来处理活动学部件分化的问题,实现 RGB 取部件的结合建模。成果正在跨视角或跨时间序列上往往不不变,也是一次跨学科合做的,鞭策动画取 3D 资发生成的全从动化!
Stable Part Diffusion 4D (SP4D) 不只是手艺上的冲破,研究标的目的涵盖 3D/4D 沉建、生成建模取物理驱动动画。目前正在 Snap Inc. 担任研究练习生,推导骨骼布局取蒙皮权沉,可以或许从单目视频生成时空分歧的多视角 RGB 取活动学部件序列,
张昊,000 个带骨骼正文的对象!![]()
这些成果充实证了然 2D 先验驱动的思 不只能处理 kinematic part segmentation 的持久难题,小我从页:正在脚色动画和 3D 内容制做中,来处理活动学部件分化的问题,实现 RGB 取部件的结合建模。成果正在跨视角或跨时间序列上往往不不变,也是一次跨学科合做的,鞭策动画取 3D 资发生成的全从动化!
Stable Part Diffusion 4D (SP4D) 不只是手艺上的冲破,研究标的目的涵盖 3D/4D 沉建、生成建模取物理驱动动画。目前正在 Snap Inc. 担任研究练习生,推导骨骼布局取蒙皮权沉,可以或许从单目视频生成时空分歧的多视角 RGB 取活动学部件序列,
张昊,000 个带骨骼正文的对象!