首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
FP-tree上频繁概念格的无冗余关联规则提取   总被引:1,自引:0,他引:1  
为解决经典关联规则生成算法挖掘效率低及形成规则冗余性大的问题,提出在FP-tree基础上直接生成频繁概念格并提取无冗余关联规则的算法。其建格过程根据FP-tree频繁项目头表中各项的索引可分别独立进行,由支持度计数约束进行结点的筛选,形成频繁概念格的Hasse图,图中结点包含频繁项集及其支持度计数信息,通过对全部叶子结点的扫描可生成无冗余关联规则。通过实例验证该算法行之有效。  相似文献   

2.
基于概念格的数据挖掘方法研究   总被引:10,自引:0,他引:10  
王旭阳  李明 《计算机应用》2005,25(4):827-829
分析了概念格和关联规则之间的关系,提出了将频繁项集及其支持度存储在概念格上,然后在创建好的概念格上提取关联规则的方法,以及数据发生变化以后概念格的维护算法。  相似文献   

3.
基于量化规则格的关联规则之分布式获取   总被引:1,自引:1,他引:0  
在形式概念分析中,提取关联规则是构造概念格的目的之一。量化规则格是为了便于提取规则的扩展概念格。概念格分布处理是先分布构造多个部分概念格,再合并构造出完整概念格,以提高构造格的速度。本文提出一种规则合并技术和相应的算法,由部分量化规则格提取部分关联规则,然后直接进行部分关联规则的合并,得到完整的关联规则,即对关联规则进行分布提取。由于无需构造完整格,并且直接再利用已有的部分关联规则,从而降低了利用概念格提取关联规则的复杂度。最后,给出一个简单的实例,说明算法的正确性,并通过实验验证了算法的有效性。  相似文献   

4.
基于属性链表的关联规则格的渐进式构造算法   总被引:4,自引:0,他引:4  
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究。而由二元关系导出的概念格则是一种非常有用的形式化工具,非常适于发现数据中潜在的概念。分析了概念格与关联规则提取之间的关系,根据需要对格结构进行了相应的修改,提出了关联规则格的概念,并提出属性链表这种数据结构,基于这种链表提出了关联规则格的渐进式构造算法。通过对算法进行分析,得出了比Godin算法更好的时间效率。  相似文献   

5.
许多研究表明概念格是数据分析与规则提取的一种有效工具.本文首先提出基于最大频繁项集幂集格上的规则提取算法.然后对此种算法进行改进,在已建好的概念格上直接从最大频繁项集进行规则提取,因而提高了挖掘关联规则的效率,适用于大型数据库中关联规则的挖掘.  相似文献   

6.
基于概念格的关联规则发现   总被引:9,自引:0,他引:9  
关联规则是数据库中有价值的一类规律,国内外学者已经对它进行了广泛的研究,由二元关系导出的概念格作为一种非常有用的形式化工具,体现了概念内和外延的统一,反映了对象和特征间的联系以及概念的泛化与例化关系,因此非常适于发现数据中潜在的概念。本文报概念格的关联规则提取之间的关系,根据需要对格结构进行了相应的修改,提出了概念格结点内涵缩减概念,给出了相应的渐进式生成算法和基于概念格的关联规则提取算法,并通过  相似文献   

7.
数据挖掘中传统的关联规则生成算法产生的关联规则集合相当庞大,其中很多规则可由其它规则导出。使用闭项集可以减少规则的数目,而概念格节点间的泛化和例化关系非常适用于规则的提取。目前几种基于概念格的规则提取算法局限于得到准确支持度、信任度的无冗余规则。提出了一种在概念格上挖掘出能推导出所有满足最小支持度、信任度规则的规则产生集算法,文中称之为组规则产生集算法,减少了规则的规模。在此基础上进一步给出了组规则产生集的存储数据结构并用其导出一般规则产生集的算法。  相似文献   

8.
概念格与关联规则发现   总被引:64,自引:4,他引:60  
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究。而由二元关系导出的概念格则是一种非常有用的形式化工具。它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系,因此非常适于发现数据中潜在的概念。分析了概念格与关联规则提取之间的关系,根据需要对格结构进行了相应的修改,提出了相应的渐进式生成算法和基于概念格的关联规则提取算法,通过定理和性质对算法进行了说明并对关联规则进行缩减。最后对格结构的复杂性进行了讨论并给出了相应的实验结果。  相似文献   

9.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

10.
加权概念格的渐进式构造及其关联规则提取   总被引:3,自引:2,他引:1  
概念格的每个结点本质上是一个最大项目集,非常有利于关联规则的提取。然而目前对于概念格的研究,一般都假定由属性集所组成概念格的内涵同等重要,而在现实数据库中,组成内涵的属性重要性往往是不同的,因此,内涵并非同等重要。为了充分利用概念格实现关联规则提取,提出了一种新的概念格结构:加权概念格,并给出其渐进式构造算法及基于该格结构上的关联规则提取算法,同时给出算法分析以说明其可行性。  相似文献   

11.
区间概念格理论是在区间参数基础上提出的一种新的对象挖掘方法,它能够更精确地处理不确定信息。区间参数[[α,β]]决定了区间概念和格结构,并对区间关联规则产生影响。针对区间参数对关联规则的控制和优化问题,首先提出了基于参数变化的区间概念格结构更新算法,随着区间参数等步长变化,对初始格结构进行更新;然后在此基础上进一步挖掘各区间参数下的关联规则,发现区间参数和关联规则之间的复杂联系,给出了规则库优化算法,该算法通过调整参数达到控制和优化规则的目的;最后对决策形式背景进行规则提取并验证了区间参数对关联规则的具体影响。  相似文献   

12.
张茹  张春英  王立亚  刘保相 《计算机应用》2015,35(11):3213-3217
为解决直接对不同形式背景的数据构建区间概念格后分别抽取关联规则会存在规则缺失的实际问题,必须首先对不同的区间概念格进行合并.为提高格结构的生成与合并效率,首先对区间概念格的渐进式生成算法进行改进,将概念分为存在概念、冗余概念和空概念,分别以结构体的形式存储;进一步,分析区间概念格中外延和内涵之间的二元关系,给出了区间概念格纵向合并的充分条件——区间概念格的一致性;讨论了内涵一致的概念在合并后分为六种情况,并给出相应的判定定理;应用广度优先原则,通过对原区间概念格节点内涵的类型判定及不同的处理方法,设计了一种区间概念格的纵向合并算法.最后,通过实例验证了算法的有效性和高效性.  相似文献   

13.
时序波动关联规则概念格并行挖掘的一个新算法   总被引:1,自引:0,他引:1  
基于概念格理论,研究了对时间序列的波动情况进行周期关联规则的挖掘.首先对时间序列进行了反季节化预处理,然后提出了生成周期关联规则的新并行算法,在算法内部对生成的概念进行了剪枝处理,有效地提高了挖掘速度.随后用所给出的高精度模型对不满足移动平均法反季节化预处理条件的时间序列进行了反季节化计算.实验证明了该方法的有效性.  相似文献   

14.
传统的关联规则表示方法无法展示概念之间的本质关系,缺少对概念层面的认识,忽略了知识发现结果的共享等问题,而概念格作为一种能够生动简洁地体现概念之间泛化和例化关系的数据结构,在对关联规则可视化和发现潜在知识方面也有着独特的优势。提出了以概念格为背景的关联规则可视化方法,以概念为查找单元,在概念格中寻找需要展示的关联规则路径,将属性之间的关联关系扩展到概念层面,并给出了相对应的多模式规则的可视化的策略与算法。结合某校图书馆借书记录数据,进行关联规则分析与可视化实现。实验结果表明,该可视化方法在知识发现和共享方面具有良好的效果。  相似文献   

15.
关联规则挖掘是数据挖掘中的一项核心任务,而由二元关系导出的概念格则是一种非常有用的形式化分析工具,它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系。一个概念内涵与一个关联规则中的闭合项集可以一一对应。提出了一种新有基于概念格的关联规则挖掘算法Arca(Association Rule based Concept lAttice)。Arca算法通过概念矩阵构造部分概念格,使概念格中的每个概念对应一个闭合频繁项集。然后生成一些关联规则,在这些关联规则上通过定义了四个算子来生成了所有关联规则。  相似文献   

16.
基于概念格的规则产生集挖掘算法   总被引:27,自引:0,他引:27  
传统的规则提取算法产生的规则集合相当庞大,其中包含许多冗余的规则.使用闭项集可以减少规则的数目,而概念格结点问的泛化和例化关系非常适用于规则提取.基于概念格理论和闭项集的概念,提出了一种新的更有利于规则提取的格结构,给出了相应的基于闭标记的渐进式构造算法和规则提取算法.最后提供给用户的是直观的、易理解的规则子集,用户可以有选择地从中推导出其他的规则.实验表明该方法能够高效地挖掘规则产生集.  相似文献   

17.
A concept lattice is an ordered structure between concepts. It is particularly effective in mining association rules. However, a concept lattice is not efficient for large databases because the lattice size increases with the number of transactions. Finding an efficient strategy for dynamically updating the lattice is an important issue for real-world applications, where new transactions are constantly inserted into databases. To build an efficient storage structure for mining association rules, this study proposes a method for building the initial frequent closed itemset lattice from the original database. The lattice is updated when new transactions are inserted. The number of database rescans over the entire database is reduced in the maintenance process. The proposed algorithm is compared with building a lattice in batch mode to demonstrate the effectiveness of the proposed algorithm.  相似文献   

18.
研究概念格对象渐减维护与关联规则更新符合动态环境下概念格应用的需求。提出了对象渐减时概念的更新原则和概念间关系调整方法,并在其基础上设计了概念格对象渐减维护算法;采用了内涵缩减来获得概念蕴含的关联规则,从父子概念内涵差集的变化中发现了对象渐减时的内涵缩减更新规律;获得了对象渐减时的关联规则更新方法。  相似文献   

19.
为解决访问控制中的删除某个对象后重新构造概念格耗时的问题,对概念进行了分类,深入研究了概念格中删除对象后各个概念以及边的变化,分析了概念之间及边之间的联系和规则,在此基础上提出一种概念格的对象渐减更新算法.该算法采用渐进式构造方法,不需要重新构造概念格,而且是在原概念格的基础上采用广度优先遍历的顺序对概念格进行调整,进...  相似文献   

20.
研究对象粒度的概念格维护和关联规则更新是动态环境下概念格应用的实际需要。研究了概念格更新的规律,证明了加入新的对象时概念的生成及其插入位置只与最新生成的概念有关,与先前生成的大量概念无关。发现了概念的内涵缩减可以决定这个概念蕴涵的关联规则,同时发现了概念的内涵缩减由这个概念和其父概念的内涵差集决定。根据上述观点提出了基于对象粒度的概念格关联规则更新的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号