首页 | 本学科首页   官方微博 | 高级检索  
     

基于多源知识和Ranking SVM的中文微博命名实体链接
引用本文:陈万礼,昝红英,吴泳钢.基于多源知识和Ranking SVM的中文微博命名实体链接[J].中文信息学报,2015,29(5):117-125.
作者姓名:陈万礼  昝红英  吴泳钢
作者单位:郑州大学 信息工程学院,河南 郑州 450001
基金项目:国家社会科学基金(14BYY096);国家自然科学基金(61402419,61272221);国家高技术研究发展863计划(2012AA011101);国家重点基础研究发展计划973课题(2014CB340504)
摘    要:命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体。在NLP&CC2014中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势。


关 键 词:命名实体  中文微博实体链接  同义词词典  百科资源  Ranking  SVM  语义特征  

Chinese Micro-blog Named Entity Linking Based on Multisource Knowledge
CHEN Wanli,ZAN Hongying,WU Yonggang.Chinese Micro-blog Named Entity Linking Based on Multisource Knowledge[J].Journal of Chinese Information Processing,2015,29(5):117-125.
Authors:CHEN Wanli  ZAN Hongying  WU Yonggang
Affiliation:School of Information Engineering, Zhengzhou University, Zhengzhou, Henan 450001, China
Abstract:Named entity is an important component conveying information in texts, and an accurate understanding of named entities is necessary to ensure a correct analysis of the text information. This paper proposes a Chinese micro-blog entity linking strategy based on multi-resource knowledge under Ranking SVM framework. It combines a dictionary of synonyms, the encyclopedia resources to produce an initial set of candidate entities , then extracts various combinations of featuresfor Ranking SVM to generate the target entity set. The evaluation on data sets of NLP&CC2014 Chinese micro-blog entity linking track shows a micro average accuracy of 89.40%, which is better than the state-of-the-art result.
Keywords:named entity  chinese micro-blog entity linking  dictionary of synonyms  encyclopedia resources  Ranking SVM  semantic features  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号