首页 | 本学科首页   官方微博 | 高级检索  
     

用于知识库扩充的在线百科表格知识获取与融合
作者单位:;1.苏州大学计算机科学与技术学院;2.科大讯飞苏州研究院
摘    要:互联网中的HTML表格蕴含着丰富的结构化或半结构化知识,是知识库构建与扩充的重要数据资源。然而如何对HTML表格进行正确解析并获得三元组知识用于扩充知识库,则是一个很有挑战的问题。首先,HTML表格的结构各有不同。其次,表格与知识库中的实体和属性的表示不同,需要统一,即实体链接与属性对齐。本文首先提出了一个基于知识库的在线百科表格解析与知识融合框架,该框架可针对不同类别的表格进行知识抽取;并提出了基于知识库的表格实体链接和属性对齐方法,用以将表格中的知识与知识库进行匹配与融合。实验使用了126万在线百科表格数据为CN-DBpedia扩充约1000万三元组。

关 键 词:HTML表格  知识抽取  知识融合

Knowledge Extraction and Fusion over Online Encyclopedia Tables for Knowledge Base Augmentation
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号