论文介绍
本文提出了一个基于双重扩散机制的神经隐式场DD-NeRF,可以实现精确的三维人体重建,并渲染到其他新视角。通过在粗糙和精细两个层面整合人体形状先验和图像外观细节信息,本文提出的双重扩散机制能够实现输入图像的精确特征表示。具体来说,在粗糙层面,先用3D可变形顶点模型做监督,估计粗糙的人体姿态和形状;在精细层面,用多视角采样网络捕捉衣服、头发等精细的几何变形和图像外观细节。由于两个层面的特征都是稀疏特征,随后将特征扩散到标准空间的特征立方体中,作为神经隐式场的信息。最后,通过一个有符号距离函数回归网络,将扩散之后的特征重建成三维人体表面。在这个双重扩散机制的架构下,本方法可以泛化到训练集外没见过的人物。本方法在多个数据集上的结果超过了前沿算法,达到了更高的三维人体重建和新视角合成精度。
论文原文
https://arxiv.org/pdf/2112.12390.pdf