论文介绍
感知人类面部情绪的能力是各种多模态应用的基本特征,尤其是在智能人机交互(HCI)领域。近几十年来,人们在研究自动面部情绪识别(FER)方面付出了大量的努力。然而,大多数现有的FER方法要么只关注基本情绪,如七/八类(例如快乐、愤怒和惊讶),要么关注抽象维度(唤醒等),而忽略了情绪陈述的丰富性。在现实场景中,肯定有更多的词汇来描述人类的内心感受以及他们对面部表情的反映。在这项工作中,我们建议解决FER问题中的语义丰富性问题,重点是情感概念的粒度。特别是,我们从以前的心理语言学研究中获得灵感,进行了原型评级研究,并从数百个英语情感术语中选择了135个情感名称。基于135种情绪类别,我们通过收集大规模的135类FER图像数据集来研究相应的面部表情,并提出相应的面部情绪识别框架。为了证明将FER研究推进到细粒度水平,我们对数据集的可信度和伴随的基线分类模型进行了广泛的评估。定性和定量结果证明问题是有意义的,我们的解决方案是有效的。据我们所知,这是第一项旨在利用如此大的语义空间来表达FER问题中的情感的工作。
论文地址
https://ieeexplore.ieee.org/document/9866516