首页 | 本学科首页   官方微博 | 高级检索  
     

模式级链接关联数据集上的关联规则挖掘研究
引用本文:袁柳,张龙波.模式级链接关联数据集上的关联规则挖掘研究[J].计算机科学,2016,43(9):91-98.
作者姓名:袁柳  张龙波
作者单位:陕西师范大学计算机科学学院 西安710062,山东理工大学计算机学院 淄博255049
基金项目:本文受国家自然科学基金项目:云计算环境下旅游信息个性化服务模型研究(41271387),中央高校基本科研业务费专项资金:模式级链接开放关联数据集上的数据挖掘关键技术研究(GK201503066)资助
摘    要:针对关联数据集合呈现出的大数据特性和蕴含的语义信息,提出了首先建立关联数据集的模式级链接,再进行关联规则挖掘的方法。在同领域RDF数据集上定义RDF数据项模式并提出数据项模式的产生规则;利用RDF数据查询技术从数据项模式获得RDF数据项集合,进而再推导出特定领域内的关联规则。提出的基于关联数据RDF数据项模式的关联规则挖掘方法将关联规则挖掘扩展到同一领域内的数据集合而不再局限于单一数据集,同时给出了基于Hadoop的大规模RDF数据集上的关联规则挖掘的实现方案。实验结果验证了模式级链接对于关联规则挖掘的价值和所提方法的有效性。

关 键 词:语义大数据  关联数据  本体  RDF  关联规则
收稿时间:8/1/2015 12:00:00 AM
修稿时间:2015/9/21 0:00:00

Association Rules Mining on Schema-level Interconnected Associated Data
YUAN Liu and ZHANG Long-bo.Association Rules Mining on Schema-level Interconnected Associated Data[J].Computer Science,2016,43(9):91-98.
Authors:YUAN Liu and ZHANG Long-bo
Abstract:A schema-level interconnected association rules mining method for large scale associated data was proposed based on the semantic information implied in the associated data set.Instead of mining association rules from separated RDF data sets directly, firstly,we established schema-level linkage between different data sets.The RDF data item pattern generation rules are defined based on the schema-level linked datasets and then the RDF data query techniques are exploited for constructing RDF data items sets.The proposed data item patterns generation rules can extend the data mining objects from a single data set to multi-datasets in the same domain.A Hadoop based implementation plan of association rules mining was designed.The experiment results prove the value of establishing schema-level linkage on linked data and the effectiveness of the proposed method.
Keywords:Semantic big data  Associated data  Ontology  RDF  Association rules
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号