论文简介
近年来,自注意力机制在序列推荐场景中展现出了极大的优势,在许多任务中取得了SOTA的表现。然而,自注意力机制的两个重要的问题限制了其在此场景中的大规模应用和进一步发展,这两个问题分别是
1):自注意力的时间复杂度是其输出序列长度的平方,使其在面对长交互序列时变得并不高效;
2):自注意力依赖于positional embedding来学习序列信息,而在将自注意力应用的序列推荐的开山之作-SASRec中,作者就指出positional embedding的效果有时并不明显,甚至还会起到反作用。
最近,MLP结构的一系列进步显示,在不使用自注意力机制的情况下,仅仅使用MLP也能够达到极具有竞争力的表现。基于此,我们提出MLP4Rec,一种利用三向信息融合,能够一致结合序列信息、embedding语义、商品特征信息的模型结构。
MLP4Rec吸取了近期新型MLP结构的优势,并进一步将双向信息融合改进为三向信息融合,提升了模型捕捉特征层面序列信息和全局表征的能力,在多个常用的benchmarks中展现了极具竞争力,甚至达到了SOTA的表现。更重要的是,MLP4Rec的理论时间复杂度和空间复杂度均为线性增长,并且得益于MLP的特质,MLP4Rec本身就对序列信息有敏感性,使其相较于自注意力机制,有着更大的发展潜力和探索价值。
论文地址
https://arxiv.org/abs/2204.11510