异构信息网络(HIN)是将一个或多个数据集建模为由节点和边组成有向图的一种相对简单的方法,其中所有节点和边都有定义的类型。节点和边类型的集合代表网络的模式,这不同于节点和边都是相同类型的同构网络。
异构信息网络为复杂数据集的建模提供了非常丰富的联想。对异构信息网络进行特征化的常用技术是针对图定义元路径,然后针对定义的元路径执行引导随机游走。元路径表示通过特定节点和边序列的图遍历,元路径选择类似于经典机器学习中的特征工程,因此选择预测变量提供有用信号的元路径就非常重要。
元路径通常单独或组合评估以确定它们对模型性能的影响。针对元路径的引导式随机游走产生一系列节点,使用Skipgram或CBOW模型来创建嵌入,一旦节点被表示为嵌入,类似于SVM、DNN等模型便可用于解决相似性搜索、分类、聚类、推荐等类型的问题。