首页 | 本学科首页   官方微博 | 高级检索  
     

一种大规模RDF语义数据的分布式存储方案
作者姓名:姜龙翔  王鑫  李旭  冯志勇
作者单位:1. 天津大学软件学院 天津300072
2. 天津大学计算机科学与技术学院 天津300072
基金项目:国家自然科学基金项目(61070202); 天津大学自主创新基金(60302022)
摘    要:随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以有效地管理海量的RDF数据,并通过构建索引可以有效地对大规模RDF数据进行查询。工作包括底层的RDF存储方案的设计与实现,数据的预处理与装载。同时,设计了一系列实验来评估和对比不同节点数目的Cassandra集群之间的性能,数据采用的是从DBpedia获得的13 million行RDF的数据集。实验结果显示,方案对大规模RDF语义数据的存储和查询具有性能优势。

关 键 词:RDF语义数据  分布式存储  三元组索引  Cassandra集群  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号