论文介绍
空间信息的丢失以及在自然环境中的头部姿态变化幅度大,让从没有深度信息的RGB图像中估计头部姿态变成一项具有挑战性的任务。由于估计姿态的质量较差,现有的无标志方法的性能仍然不令人满意。在本文中,我们提出了一种新的三分支网络架构,称为特征解耦网络(FDN),这是一种更强大的架构,用于从单个RGB图像中估计无地标头部姿态。在FDN中,我们首先提出了一个特征去耦(FD)模块,通过自适应地重新校准每个姿态角的信道方向响应来显式地学习每个姿态角度的辨别特征。此外,我们引入了交叉类别中心(CCC)损失来约束潜在变量子空间的分布,从而可以获得更紧凑和不同的子空间。在野外和受控环境数据集上的大量实验表明,所提出的方法优于基于单个RGB图像的其他最先进的方法,并且与基于多模态输入资源的方法表现相同。
论文地址
https://ojs.aaai.org/index.php/AAAI/article/view/6974