首页 | 本学科首页   官方微博 | 高级检索  
     

基于维基百科的领域实体发现研究
引用本文:邢富坤. 基于维基百科的领域实体发现研究[J]. 计算机应用研究, 2015, 0(2): 347-350,367
作者姓名:邢富坤
作者单位:解放军外国语学院 语言工程系,河南 洛阳,471003
基金项目:国家社会科学基金资助项目(11 BYY126);中央文献对外翻译与传播协同创新中心2013年度科学研究项目
摘    要:提出一种基于维基百科的领域实体发现方法,该方法将构成领域实体的典型字或词作为种子元素,利用少量种子元素作为实体发现的初始知识,有效地克服了传统方法在获取种子词条时过分依赖领域专家的局限,同时还利用维基百科词条中的分类信息,通过计算维基百科类与领域类间的隶属度实现领域实体的有效扩充。人工抽样对实体发现结果进行检验,平均准确率达到80%左右,同时还将构建出的领域实体知识应用到文本分类中,结果显示,当训练集具有一定规模时,以实体为特征的分类模型的准确率较以词为特征分类模型的准确率有显著提高,说明实体知识在实际应用中的有效性。提出的方法具有较好的领域独立性和语种独立性,可较为便捷地移植到其他语种与领域。

关 键 词:领域实体  维基百科  隶属度  自动发现

Domain entities discovery based on Wikipedia
XING Fu-kun. Domain entities discovery based on Wikipedia[J]. Application Research of Computers, 2015, 0(2): 347-350,367
Authors:XING Fu-kun
Affiliation:XING Fu-kun;Dept. of Language Engineering,PLA Foreign Languages University;
Abstract:
Keywords:domain entity  Wikipedia  membership  automatic detection
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号