一种引入元路径相似性度量的材料实体检索方法OA北大核心CSTPCD
近年来,随着材料数据的积累以及“材料基因组计划”的普及,面对大量需要处理和管理的材料数据,快速准确地检索并获取相应信息已成为一个重要问题。传统的检索方法由于仅能查询某一材料的相关信息,并且存在检索结果不全面、无法处理复杂语义关系等问题,难以获取相似程度较高的材料。为了快速、准确地找到与某种材料相似的材料,提出可度量不同节点的加权材料相似度计算模型WM-PathSim。首先,使用metapath2vec学习材料节点的嵌入表示;其次,引入TFIDF-CBOW模型学习材料路径实例的存在概率,进而计算不同元路径的权重;最后,加权求和符合条件的元路径得到最后的相似性度量,来预测不同材料之间的相似程度。在真实数据集上的结果表明,在不同的路径关系中,所提模型相比于基线方法在性能上有较大提升,其AUC和precision指标分别提升了0.37~5.02百分点和1~7.33百分点,说明所提模型得到材料间的相似程度更加准确和有效,从而能够获得相似材料。
黄华泽;胡紫璇;游进国;黄星瑞;陶静梅;易健宏;
昆明理工大学信息工程与自动化学院,昆明650500昆明理工大学信息工程与自动化学院,昆明650500 云南省人工智能重点实验室,昆明650500昆明理工大学材料科学与工程学院,昆明650093
计算机与自动化
材料相似度metapath2vecTFIDF-CBOW元路径权重
《计算机应用研究》 2024 (009)
P.2781-2786 / 6
国家自然科学基金资助项目(62062046)。
评论