SLTA-PathSim:一种融合节点属性和文本信息的相似性度量算法

【摘要】 作为融合大规模信息的有效工具,异质信息网络在数据挖掘任务中一直具有重要的实用意义.文献信息网络作为一种典型的异质信息网络,基于其的作者相似性度量问题近年来得到了广泛的关注.尽管PathSim算法在解决该问题上取得了很好的效果,但该方法仅仅关注网络结构和元路径下的语义信息,忽略了节点属性和文本信息等因素的影响.在PathSim算法的基础上,本文提出了SLTA-PathSim算法,该算法包括基于节点属性的SL-PathSim(SignatureLocation-PathSim)算法和基于文本信息的TA-PathSim(TitleandAbstract-PathSim)算法.通过在AMnier数据集上查找与指定作者相似的Top-k作者,验证了SLTA-PathSim的有效性.关键词:文献信息网络