首页 | 本学科首页   官方微博 | 高级检索  
     

基于规则的百科人物属性抽取
作者姓名:李红亮  杨燕  尹红风  贾真
作者单位:西南交通大学信息科学与技术学院 成都 610031;西南交通大学信息科学与技术学院 成都 610031;西南交通大学信息科学与技术学院 成都 610031;西南交通大学信息科学与技术学院 成都 610031
摘    要:信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数 据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信 息也是计算机所能理解的一种数据格式。作者提出了一种自动获取百科人物属性的方法,该方法利用各属性值的词性信 息来定位到百科自由文本中,通过统计的方法发现规则,再根据规则匹配从百科文本中获取人物属性信息。实验表明该 方法从百科文本中抽取人物属性信息是有效的。抽取的结果可以用来构建人物属性知识库。

关 键 词:人物属性抽取  规则获取  自由文本
点击此处可从《集成技术》浏览原始摘要信息
点击此处可从《集成技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号