首页 | 本学科首页   官方微博 | 高级检索  
     

一种大规模RDF语义数据的分布式存储方案
引用本文:姜龙翔,王鑫,李旭,冯志勇.一种大规模RDF语义数据的分布式存储方案[J].计算机应用与软件,2011,28(11).
作者姓名:姜龙翔  王鑫  李旭  冯志勇
作者单位:1. 天津大学软件学院 天津300072
2. 天津大学计算机科学与技术学院 天津300072
基金项目:国家自然科学基金项目(61070202); 天津大学自主创新基金(60302022)
摘    要:随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以有效地管理海量的RDF数据,并通过构建索引可以有效地对大规模RDF数据进行查询。工作包括底层的RDF存储方案的设计与实现,数据的预处理与装载。同时,设计了一系列实验来评估和对比不同节点数目的Cassandra集群之间的性能,数据采用的是从DBpedia获得的13 million行RDF的数据集。实验结果显示,方案对大规模RDF语义数据的存储和查询具有性能优势。

关 键 词:RDF语义数据  分布式存储  三元组索引  Cassandra集群  

A DISTRIBUTED STORAGE SCHEME FOR LARGE-SCALE RDF SEMANTIC DATA
Jiang Longxiang,Wang Xin,Li Xu,Feng Zhiyong.A DISTRIBUTED STORAGE SCHEME FOR LARGE-SCALE RDF SEMANTIC DATA[J].Computer Applications and Software,2011,28(11).
Authors:Jiang Longxiang  Wang Xin  Li Xu  Feng Zhiyong
Affiliation:Jiang Longxiang~1 Wang Xin~2 Li Xu~2 Feng Zhiyong~2 1(School of Computer Software,Tianjin University,Tianjin 300072,China) 2(School of Computer Science and Technology,China)
Abstract:With the development of the Semantic Web,a global interconnected media is being generated,more and more RDF datasets are published on the Web.A DBMS that can store and query large RDF data is needed.To tackle the problem,the authors have designed and implemented a distributed RDF semantic data storage scheme.The scheme manages and queries RDF data effectively by loading and building triple indexing for RDF triples.The job includes designing and implementing the underlying RDF storage scheme,data pre-process...
Keywords:RDF semantic data  Distributed storage  Triple index  Cassandra cluster  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号