首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一个面向大规模数据库的数据挖掘系统   总被引:18,自引:0,他引:18  
钱卫宁  魏藜  王焱  钱海蕾  周傲英 《软件学报》2002,13(8):1540-1545
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统--Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.  相似文献   

2.
研究并开发了一个原型系统PDMQL,实现了一种数据挖掘查询语言的原型,以该语言的语法分析为核心,把3类主要挖掘功能紧密联系起来,并实现了结果数据集到XML文档的转换.  相似文献   

3.
OWL本体关系数据库存储模式设计   总被引:3,自引:2,他引:3  
本体合理有效的存储是保证本体共享利用的前提,现有的关系数据库本体存储模式在存储OWL本体后会出现查询推理效率低、维护困难等问题。文中在分析现有模式的基础上,针对OWL本体类和属性的特点,通过单独设立类关系表、添加关系约束表T—restrict等方法改进已有模式,使其能比较方便地实现OWL本体中类、属性及复杂关系的信息存储,学校本体的存储实例表明存储实现简单,查询实验表明查询检索效率有一定提高,从而说明本体存储模式的设计是可行的。  相似文献   

4.
为了给数据分析和挖掘提供一个有效的、交互的查询环境,将基于约束的数据挖掘与多维的数据挖掘结合成一个整体来进行。介绍了建立一集成的联机分析挖掘和联机分析处理结构,来实现这种用户与系统间的交互。实践表明,基于约束的数据挖掘与多维的数据挖掘结合在一起,大大提高了查询的目的性和效率,可为用户选择所期望的挖掘功能和动态地改变数据挖掘任务提供了更加灵活的手段。  相似文献   

5.
数据挖掘语言标准化的研究是开发新一代数据挖掘系统的关键。DMX(Data Mining Extensions,数据挖掘扩展)是OLE DBFor DM规范支持的数据挖掘查询语言,支持数据挖掘系统直接对关系数据库进行挖掘,是数据挖掘原语标准化发展中的一个突破。该文介绍了OLE DB For DM规范下数据挖掘的主要步骤,给出了Microsoft SQL Server Analysis Services中基于DMX的实现方法。  相似文献   

6.
频繁模式挖掘是多种数据挖掘应用中的关键问题。以一种高效的频繁模式挖掘算法FP-gowth算法为例,利用关系数据库中的表来存储频繁模式村FP-tree,通过标准SQL语言硬Oracle数据库PL/SQL编程技术实现了这种基于SQL的频繁模式挖掘方法.并给出了该方法较为详细的实现步骤。  相似文献   

7.
一种基于Agent的数据挖掘结果模式推荐模型   总被引:3,自引:0,他引:3  
结合数据挖掘模式存储和人工智能Agent技术,提出了基于智能个性化Agent的数据挖掘结果模式的推荐模型,该推荐模型能自动对用户兴趣进行分析,并向用户推荐其感兴趣而又值得关注的挖掘结果模式,有一定的实用价值。  相似文献   

8.
关系数据库中关联规则挖掘的一种高效算法   总被引:10,自引:0,他引:10  
王芳  王万森 《微机发展》2004,14(9):20-22
近年来,关系数据库被越来越多的行业采用,大量的生产、管理、科研等信息被收集存储,因此在关系数据库中进行有效的关联规则挖掘的需求日益增强。文中根据事务数据库中布尔型关联规则挖掘的相关理论和方法,在分析了关系数据库中关联规则挖掘具有的特殊性的基础上,从利用结构化查询语言(SQL)对关系数据库简便而高效的操作出发,提出了一种在关系数据库中挖掘多值型、多维型关联规则的简易算法。实验证明该算法具有较高的执行效率和一定的实用性。  相似文献   

9.
陶皖  姚红燕 《微机发展》2007,17(2):111-114
本体合理有效的存储是保证本体共享利用的前提,现有的关系数据库本体存储模式在存储OWL本体后会出现查询推理效率低、维护困难等问题。文中在分析现有模式的基础上,针对OWL本体类和属性的特点,通过单独设立类关系表、添加关系约束表T-restrict等方法改进已有模式,使其能比较方便地实现OWL本体中类、属性及复杂关系的信息存储,学校本体的存储实例表明存储实现简单,查询实验表明查询检索效率有一定提高,从而说明本体存储模式的设计是可行的。  相似文献   

10.
传统的SPARQL查询引擎在处理查询时以三元组模式为基本单位做查询优化处理,在三元组模式较多时存在着过多的连接操作,开销比较大。文中基于文档数据库的存储和查询特点,提出一种利用主语分类的方式来存储RDF数据的方法,将不同的RDF三元组按主语分成不同的类,并存入文档数据库的文档中。在处理SPARQL查询时将三元组模式也按照主语分类,构成以主语相关块为单位的查询图,并提出一种基于属性相关性的选择度估计方法来优化查询执行计划。文中利用文档数据库CouchDB实现了新的SPARQL查询引擎,实验证明文中的方法能够提高SPARQL基本图模式查询的效率。  相似文献   

11.
在约束关联规则挖掘过程中,影响交互的制约因素是挖掘算法的执行时间。为了提高挖掘过程的交互性,文章提出一种基于两阶段的约束关联规则挖掘算法。算法利用已挖掘的关联规则,实现约束关联规则的挖掘过程。在算法实现的过程中对关联规则集存储结构进行了优化,并扩展了类SQL查询语句。实验结果表明,由于在约束条件挖掘的过程中不需要再对数据库进行挖掘处理,节省了大量的用户时间,因此算法是有效的。  相似文献   

12.
基于预聚类技术的并行序贯模式挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
本文讨论了在并行序贯模式数据挖掘方面采用“预聚类并行序贯模式挖掘”的策略,对数据序列聚类后按不同的类分布到不同的并行节点上,以减少甚至消除不必要的通讯开销,以便能够提高并行序贯模式挖掘在集群式高性能计算机上的执行效率。  相似文献   

13.
频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以"批处理"方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要。MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用。将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘。实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升。  相似文献   

14.
一个XML的数据模型及其存储策略   总被引:6,自引:0,他引:6  
XML是用于数据表示、交换的Internet标准。通过和DTD的连接可以用像XML-QL这样的语言来执行丰富的查询操作。近年来,很多人致力于半结构化数据模型和其查询语言的研究^[1,2,5],其重点逐渐转移到XML数据集的查询上来,其中两个重要问题是使XML查询语言正规化和如何将XML数据转换为底层存储格式以获得理想的效率^[4]。表述了一个XML的正规数据模型及其代数方法,并介绍基于RDBMS实现该模型的方法。  相似文献   

15.
基于聚类的位置数据库动态重组   总被引:2,自引:2,他引:2       下载免费PDF全文
在无线移动计算环境中,如何合理地组织和存储移动对象(mobile object)的配置信息从而有效地降低查询和更新代价是位置管理(location management)中的一个重要问题.将数据挖掘应用到移动计算环境中是一项具有挑战性的研究课题,具有广阔的应用前景.从数据挖掘的角度出发,提出了一种优化位置数据库的解决方案.首先采用一种新的层次聚类算法对移动日志聚类,然后根据聚类的结果对位置数据库动态重组,从而有效地降低了查询和更新代价.  相似文献   

16.
刘琨  吴绍春 《计算机工程与设计》2007,28(16):3998-4000,4003
时间序列模式在很多领域中存在,时序模式的表示及存储查询是时间序列数据挖掘的重要任务之一.分析和研究了地震前兆时序模式的特点,采用半结构化语言XML并利用分段线性表示法表示地震前兆时序模式,在此基础上提出了针对Java、PL/SQL、命令行3种不同环境下地震前兆时序模式存储及查询方法,既保证了时序模式的存储查询效率,又满足了不同平台下针对时序模式的处理,从而进一步为地震预报服务.  相似文献   

17.
为提升树形结构模式和级联关系模式下的查询执行效率,提出一种行列混合式存储方法。通过在列存中引入分组概念,形成逻辑上完整但局部上独立的列组物理单元。研究分析了现有单纯行存储和列存储的优势和潜在不足,并在此基础上通过模式驱动对这一存储方法进行物理设计,使得研究能够适用主流的列存架构。基于开源框架Avro的列存内核Trevni,研究对所提方法予以实现以期显著降低列存到元组转换过程中的开销,同时保证数据交换仅限于查询所需的列。为提高在复杂模式下的可用性,基于union对存储结构进行优化,使得访问能够集中于有效的单元中,并基于空值支持关系查询场景中不满足外关键字约束的模式。实验基于十亿条TPCH数据进行,通过构建三层嵌套分组模式执行查询。结果表明,所提方法较传统行列存储方法效率有显著提升。  相似文献   

18.
朱卫星  徐伟光  何红悦  李雯 《计算机科学》2017,44(Z11):411-413, 456
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。  相似文献   

19.
介绍一个面向对象的科研信息数据库管理系统的设计与实现,首先定义了能够存储和操纵多媒体数据的图文字段;其次较为深入地探讨了类,对象及其关联在关系数据库中的存储表示方法,提出了使用操作标识与历史标识两类对象标识辅助系统进行对象存储管理的策略;接头探讨并实现了对象的查询及优化,最后介绍了系统的管理流程.  相似文献   

20.
随着XML技术的发展,如何利用现有的数据库技术存储和查询XML文档已成为XML数据管理领域研究的热点问题。本文介绍了一种新的文档编码方法,以及基于这种编码方式提出了一种新的XML文档存储方法。方法按照文档中结点类型将XML文档树型结构分解为结点,分别存储到对应的关系表中,这种方法能够将任意结构的文档存储到一个固定的关系模式中。同时为了便于实现数据的查询,将文档中出现的简单路径模式也存储为一个表。这种新的文档存储方法能够有效地支持文档的查询操作,并能根据结点的编码信息实现原XML文档的正确恢复。最后,对本文提出的存储方法和恢复算法进行了实验验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号