首页 | 本学科首页   官方微博 | 高级检索  
     

基于有效上下文信息的变体词还原方法
引用本文:游绩榕,沙瀛,梁棋,王斌. 基于有效上下文信息的变体词还原方法[J]. 计算机应用研究, 2019, 36(6)
作者姓名:游绩榕  沙瀛  梁棋  王斌
作者单位:中国科学院信息工程研究所第二研究室,北京100093;中国科学院大学网络空间安全学院,北京100049;中国科学院信息工程研究所第二研究室,北京100093;中国科学院大学网络空间安全学院,北京100049;中国科学院信息工程研究所第二研究室,北京100093;中国科学院大学网络空间安全学院,北京100049;中国科学院信息工程研究所第二研究室,北京100093;中国科学院大学网络空间安全学院,北京100049
摘    要:在社交网络上,用户常创造一些变体词来替代部分实体名词,将这些变体词还原为原目标词是自然语言处理中的一项重要工作。针对现有变体词还原方法准确率不够高的问题,提出了基于有效上下文信息的变体词还原方法。该方法利用点互信息抽取出变体词和候选目标词的有效上下文信息,并将其融合进自编码器模型中,获得变体词和候选目标词更准确的编码,并依据此计算相似度进行候选目标词排序,更准确的实现了变体词还原任务。实验表明,该方法较当前主流的几种方法相比效果有显著提升,提高了变体词还原的准确率。

关 键 词:变体词  变体词还原  自编码器  有效上下文信息  词嵌入  神经网络
收稿时间:2018-01-18
修稿时间:2018-03-01

Morph Resolution Based on Effective Context Information
You Jirong,Sha Ying,Liang Qi and Wang Bin. Morph Resolution Based on Effective Context Information[J]. Application Research of Computers, 2019, 36(6)
Authors:You Jirong  Sha Ying  Liang Qi  Wang Bin
Affiliation:Institute of Information Engineering,Chinese Academy of Sciences,Beijing,,,
Abstract:In social networks, people often creates morphs to replace some entity names. How to resolve these morphs to their real target entities is a very important task for natural language processing. In order to overcome the shortcomings that existing methods cannot resolve morphs accurately, this paper proposed a morph resolution method based on effective context information. This method extracted the effective context information of morphs and target candidates, and integrated the effective context information into autoencoders in order to get more accurate embedding of morphs and their target candidates. This method then calculate the similarity between morphs and target candidates based on the accurate embeddings, and ranked the target candidates according to the similarity. The experiments show that this approach significant outperforms the state-of-the-art methods and improves the accuracy of morph resolution.
Keywords:morph   morph resolution   autoencoder   effective context information   word embedding   neural network
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号