首页 | 本学科首页   官方微博 | 高级检索  
     

基于语义网的中文百科知识组织与集成
引用本文:付宇新,王鑫,冯志勇,吕雪栋.基于语义网的中文百科知识组织与集成[J].计算机工程与应用,2015(14).
作者姓名:付宇新  王鑫  冯志勇  吕雪栋
作者单位:1. 天津大学 计算机科学与技术学院 计算机科学与技术系,天津,300072
2. 天津大学 计算机科学与技术学院 计算机科学与技术系,天津 300072; 天津市认知计算与应用重点实验室,天津 300072
基金项目:国家自然科学基金(No.61100049,No.61070202);国家高技术研究发展计划(863)(No.2013AA013204)。
摘    要:通过从3个最大的中文百科全书(百度百科、互动百科、中文维基百科)所包含的大规模知识数据中识别重要的结构化特征生成RDF三元组,并将这些信息数据整合加入分布式大规模RDF数据存储系统,从而构成符合Linked Data要求的中文百科知识库RDF数据集。主要工作包括,通过配置网络爬虫对百度百科和互动百科的网页进行爬取,解析其中信息框等内容,生成RDF三元组并实现三元组的动态插入;下载需要的DBpedia中文三元组数据,将三元组进行整合并存储到课题组的大规模语义数据存储库Jingwei中;设计显示动态插入和三元组模式查询的页面,通过原型系统实验,验证了该方法的有效性。

关 键 词:语义网  资源描述框架(RDF)  中文百科全书  Linked  Open  Data  Nutch

FU Yuxin,WANG Xin,FENG Zhiyong,et al Organization and integration of Chinese encyclopedia knowledge based on semantic web
FU Yuxin,WANG Xin,FENG Zhiyong,LV Xuedong.FU Yuxin,WANG Xin,FENG Zhiyong,et al Organization and integration of Chinese encyclopedia knowledge based on semantic web[J].Computer Engineering and Applications,2015(14).
Authors:FU Yuxin  WANG Xin  FENG Zhiyong  LV Xuedong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号