融合多源信息的专家学术专长语义匹配方法 |
| |
引用本文: | 谢小杰,梁英,王梓森,刘政君.融合多源信息的专家学术专长语义匹配方法[J].计算机学报,2023(5):1045-1059. |
| |
作者姓名: | 谢小杰 梁英 王梓森 刘政君 |
| |
作者单位: | 1. 中国科学院计算技术研究所泛在计算系统研究中心;2. 中国科学院大学计算机科学与技术学院;3. 移动计算与新型终端北京市重点实验室 |
| |
基金项目: | 国家重点研发计划项目(2018YFB1004700)资助~~; |
| |
摘 要: | 通过评议文档与专家库的专家学术专长匹配,可以输出领域相关的候选专家列表,是同行评议中专家遴选和专家推荐的重要参考依据.针对学术专长匹配存在语义鸿沟、无法反映专家和评议文档多源信息间语义关联的问题,首先对专家信息和评议文档的多源信息进行语义特征抽取,融合多类特征进行表示学习,利用卷积神经网络设计专家特征抽取器ExpFeat和评议特征抽取器RevFeat,采用词嵌入方法和注意力机制对专家专长标签、评议文档关键词、学科分类树语义特征进行抽取和融合,生成具有“小同行”特征的专家和评议文档语义特征向量表示,解决多类信息源间不同学术分类标准造成的语义差异,反映内在语义联系,利用低维稠密向量表达语义信息,降低匹配复杂度.然后,根据专家语义特征表示和评议文档语义特征表示进行学术专长语义匹配,将专家和评议文档特征向量映射到相同语义空间,计算向量间余弦相似度衡量语义相似性,引入负例专家进行模型训练,通过softmax函数计算最大化正例专家概率优化特征提取器参数,进一步提升语义差异的捕捉能力,解决专家信息和评议文档之间的语义鸿沟问题,提升专家匹配效果.最后,在开源的论文评审数据集和项目评审数据集上进行了实验...
|
关 键 词: | 特征抽取 语义匹配 多源信息 专家推荐 同行评议 |
|
|