首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 438 毫秒
1.
Updating generalized association rules with evolving taxonomies   总被引:2,自引:1,他引:1  
Mining generalized association rules among items in the presence of taxonomies has been recognized as an important model for data mining. Earlier work on mining generalized association rules, however, required the taxonomies to be static, ignoring the fact that the taxonomies of items cannot necessarily be kept unchanged. For instance, some items may be reclassified from one hierarchy tree to another for more suitable classification, abandoned from the taxonomies if they will no longer be produced, or added into the taxonomies as new items. Additionally, the analysts might have to dynamically adjust the taxonomies from different viewpoints so as to discover more informative rules. Under these circumstances, effectively updating the discovered generalized association rules is a crucial task. In this paper, we examine this problem and propose two novel algorithms, called Diff_ET and Diff_ET2, to update the discovered frequent itemsets. Empirical evaluation shows that the proposed algorithms are very effective and have good linear scale-up characteristics.  相似文献   

2.
概念指导的关联规则的挖掘   总被引:4,自引:0,他引:4  
关联规则是数据依赖关系泊有效描述方法,是知识发现研究的重要内容,传统的关联规则挖掘算法缺少挖掘的针对性,挖掘速度慢,挖掘效果难于理解,挖掘析数量巨大,需要进行大量的筛选以便抽取出有用规则,文中提出了将概念融入挖掘过程中,提高挖掘的效率和挖掘的针对性的方法,给出了概念指导的关联规则挖掘算法CGARM和大数据库中概念的交互式生成方法。算法CGARM是对基于分类的挖掘算法的拓展。实验结果表明,算法CGA  相似文献   

3.
王泳  吕科  潘卫国 《计算机科学》2014,41(12):143-147
围绕知识管理和提高数据挖掘模型的可解释性问题展开研究,提出了采用协同挖掘的方法对同源数据进行模式评估和知识管理的CMA算法(Collaborative Mining Algorithm)。与集成学习产生同一类型知识规则的组合学习方式不同,协同挖掘在同源数据的基础上建立不同类型的学习模型,并且每类学习模型产生的知识规则的表现形式各不相同,通过比对学习形成了一致的知识规则。实验表明,协同挖掘可以有效发现数据中的隐含信息,提高知识管理的性能。  相似文献   

4.
Online mining of fuzzy multidimensional weighted association rules   总被引:1,自引:1,他引:0  
This paper addresses the integration of fuzziness with On-Line Analytical Processing (OLAP) based association rules mining. It contributes to the ongoing research on multidimensional online association rules mining by proposing a general architecture that utilizes a fuzzy data cube for knowledge discovery. A data cube is mainly constructed to provide users with the flexibility to view data from different perspectives as some dimensions of the cube contain multiple levels of abstraction. The first step of the process described in this paper involves introducing fuzzy data cube as a remedy to the problem of handling quantitative values of dimensional attributes in a cube. This facilitates the online mining of fuzzy association rules at different levels within the constructed fuzzy data cube. Then, we investigate combining the concepts of weight and multiple-level to mine fuzzy weighted multi-cross-level association rules from the constructed fuzzy data cube. For this purpose, three different methods are introduced for single dimension, multidimensional and hybrid (integrates the other two methods) fuzzy weighted association rules mining. Each of the three methods utilizes a fuzzy data cube constructed to suite the particular method. To the best of our knowledge, this is the first effort in this direction. We compared the proposed approach to an existing approach that does not utilize fuzziness. Experimental results obtained for each of the three methods on a synthetic dataset and on the adult data of the United States census in year 2000 demonstrate the effectiveness and applicability of the proposed fuzzy OLAP based mining approach. OLAP is one of the most popular tools for on-line, fast and effective multidimensional data analysis. In the OLAP framework, data is mainly stored in data hypercubes (simply called cubes).  相似文献   

5.
基于XML数据的FP-growth算法挖掘研究   总被引:1,自引:0,他引:1  
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。  相似文献   

6.
黄江涛  刘自伟 《微机发展》2006,16(1):165-166
如何在高校有效地开展素质教育是一个迫切的问题,而通过对高校学生数据库的挖掘,有可能在这方面获得一些科学依据。文中介绍了数据仓库及数据挖掘基本技术,并将数据挖掘技术应用到成才因素分析之上,通过大量的实际数据测试,获取了感兴趣度较大的规则模式,在高校素质教育的具体应用中起到了促进的作用。最后给出了一个基于MSAnalysis Server的多维数据集及数据挖掘结果分析可视化平台。  相似文献   

7.
原始数据集中含有大量噪声数据,且数据的规模很大,直接进行关联规则挖掘会影响准确度和效率。文章提出了一种对原始数据先进行聚类,再提取关联规则的挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,提高规则挖掘的有效性。  相似文献   

8.
基于聚类和关联规则的挖掘算法   总被引:4,自引:0,他引:4       下载免费PDF全文
数据挖掘技术中关联规则可以很好地发现数据项之间存在的相互关系,同时有大量的挖掘算法可供选择。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。本文研究 聚类和关联规则的挖掘算法。  相似文献   

9.
一种基于粗糙集带支持信息的挖掘算法   总被引:1,自引:0,他引:1  
本文根据直接利用粗糙集挖掘规则难以避免偶然性、以及求出所有约简与求最小约简的问题都是NP-难的问题,提出一种求精简规则的启发式算法DR。该算法根据实际数据挖掘的特点、充分利用属性支持信息直接从数据表中挖掘高支持度和描述长度小的规则集。算法DR计算简单,其效率主要与属性的个数相关,当属性取不同值的数目不大时是一个高效算法。  相似文献   

10.
基于遗传算法的数据挖掘技术在图书馆中的应用研究   总被引:1,自引:1,他引:0  
图书馆作为信息的传统提供者,在长期的服务过程中积累了丰富的数据信息资源。将先进的数据挖掘技术引入图书馆行业,可以从现有数据资源中发掘有价值的信息,从而更好地优化馆藏、满足读者的需求和为图书管理人员提供决策支持。本文首先介绍数据挖掘和关联规则挖掘的概念,接着将遗传算法应用于关联规则挖掘中,最后通过实例挖掘图书馆读者和图书之间的关联规则。  相似文献   

11.
基于频繁模式树的分布式约束性关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
在分布式环境中挖掘约束性关联规则是当前研究的热点问题之一。该文在FP-growth算法的基础上,提出了一种新的分布式挖掘约束性关联规则算法DAMICFP。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。  相似文献   

12.
本文主要研究基于免疫遗传算法的抗菌药物数据挖掘.在数据挖掘的过程中,传统挖掘方法的精确度较低,因此,将免疫遗传算法技术应用到抗菌药物数据挖掘中,可以提高数据挖掘的准确性和及时性.数据挖掘技术为有效地分析疾病间的关系以及其出现的规律提供了新思路,以此来更好地治疗疾病,提升治疗效果.在HIS系统中对抗菌药物的数据进行分析和挖掘,获得潜在的规律和趋势,逐渐建立抗菌药物诊断知识库.依据HIS系统的医嘱数据,根据规则自主学习并更新知识库数据,从而为医生治疗患者提供合理的辅助决策.  相似文献   

13.
摘要:数据网格是在计算网格的基础上发展起来的网格技术,具有资源共享、协同工作、虚拟组织以及对分布式数据库群进行处理和分析的特点,在知识发现领域具有重要的研究价值。因此,本文提出了一种基于数据网格进行知识关联规则挖掘的方法。该方法采用数据网格树对动态数据网格进行全局控制和管理,采用挖掘作业命令的形式触发域挖掘作业,采用素数存储的方法进行了关联规则挖掘。通过仿真实验表明该挖掘方法在数据库群和数据网格关联规则挖掘方面具有优势。  相似文献   

14.
本文对某型航空发动机试车数据的数据挖掘技术应用作了研究。根据数据的特点采用粗糙集理论,研究了数据离散化处理,通过知识约简,形成了分类规则。结果表明,所得出的规则是正确的,为试车工作提供了有价值的决策信息。  相似文献   

15.
基于模糊聚类的模糊关联规则挖掘   总被引:2,自引:0,他引:2  
通过模糊聚类,从已知数据中得到数据点对数据类的隶属度,并以此进行模糊关联规则的挖掘,从而使得模糊关联规则的发现不依赖于人类专家预先给出的隶属度函数;并且实验表明。聚类并没有带来显著的顿外计算时间,对于大型数据库,文章提出的方法是有效的。  相似文献   

16.
根据加权关联关系挖掘模型和算法,提出一种基于XQuery应用的XML数据加权关联关系的挖掘方法.  相似文献   

17.
针对现阶段机械设备轴承故障诊断方法难以挖掘隐含特征、诊断精准度低等问题,将谱聚类(spectral clustering, SC)算法与关联规则算法Apriori相结合,提出SC-Apriori算法;首先根据美国西储大学轴承数据中心网站公开发布的轴承故障数据集,选取0负载下的数据,计算得到滚动轴承振动信号的9个时域特征和3个频域特征;其次使用Pearson相关系数进行特征筛选,留下9个有效特征,再利用SC-Apriori算法挖掘出训练数据集中轴承不同特征数据之间的关联关系,并引入提升度来去除冗余的关联规则,进而构建一个规则库;再将测试数据进行处理,并与已建立的规则库进行比对,根据匹配率来判断其故障类型;在测试数据上的实验结果表明,与已有算法相比,文章设计的SC-Apriori算法挖掘出的规则数量大幅减少,匹配速度更快,且匹配效果更好。  相似文献   

18.
关联规则在空间数据挖掘中的研究   总被引:2,自引:0,他引:2  
在智能化、集成化的空间数据应用领域中,空间数据挖掘是一门很重要的技术,而关联规则分析是空间数据挖掘的主要方法之一。文章基于数据挖掘中的关联规则分析方法,提出不同于一般数据挖掘的算法,设定兴趣度量,并通过将项的概念泛化为空间谓词,事务的概念泛化为邻域,关联规则的概念泛化为同位规则,发现多种形式的有效规则,并用逻辑语言或类SQL语言方式描述规则,以使空间数据挖掘趋于规范化和工程化。最后进行了实评。  相似文献   

19.
提出了一种基于H-tree的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,根据包含此模式的所有元组中的多维信息构造H-tree树,挖掘出相应的多维模式,从而得到了多维序列模式。该算法将多维分析方法与序列模式挖掘算法有效地结合在一起,当维度较高时具有较高的性能。  相似文献   

20.
基于半空间和GA的关联规则快速挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了一种利用半空间模型和遗传算法(GA)对关联规则进行快速挖掘的方法。传统关联规则挖掘算法往往受到数据类型、关联规则的实际意义等约束,大大限制了知识获取的能力。而此方法不再受到上述限制的困扰,并且可以挖掘出用户感兴趣的规则,尤其对于大规模样本集的效果也是相当不错的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号