基于词向量的中文微博实体链接方法 |
| |
作者单位: | ;1.解放军信息工程大学 |
| |
摘 要: | 实体链接是指给定实体指称项和它所在的文本,将其链接到给定知识库中的目标实体上。由于微博内容存在特征稀疏、用语不规范的特点,使用传统的方法效果较差,为了准确地对微博中给定的实体进行链接,提出一种基于词向量的中文微博实体链接方法。首先,对知识库进行扩展,并从中文维基百科抽取同义词构建同义词表;然后,利用词向量解决错别字和外来人名音译的问题;最后,通过词向量计算实体指称项和候选实体的语义相似度来进行实体链接。实验结果表明,该方法在NLP&CC2013评测数据上的微平均准确率达到了91.4%。
|
关 键 词: | 实体链接 词向量 维基百科 同义词 |
ENTITY LINKING METHOD OF CHINESE MICRO-BLOG BASED ON WORD VECTOR |
| |
Abstract: | |
| |
Keywords: | |
|
|