首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了一种基于矩阵加权关联规则的空间粒度聚类算法。该算法核心思想是根据文档特征向量矩阵提取文档的相似度,再在该关联规则算法上进行聚类来寻找相似关系的频繁项集。在粒度空间中采用相似度阀值进行调整粒度的粗细问题。通过矩阵加权关联规则算法进行聚类。通过实验表明,在处理中小型文档时,该算法的精确度优于传统Apriori算法和K—mean算法;在处理大型文档时.该算法的时间复杂度小于传统的K—mean算法。  相似文献   

2.
提出一种基于矩阵加权关联规则的空间粒度聚类算法。该算法核心思想是根据文档特征向量矩阵提取文档的相似度,再在该关联规则算法上进行聚类来寻找相似关系的频繁项集。通过引入核函数,样本点被非线性变换映射到高维特征空间进行聚类,提高聚类性能。通过矩阵加权关联规则算法进行聚类。通过实验表明,在处理中小型文档时,该算法的精确度优于传统Apriori算法和K-mean算法;在处理大型文档时,该算法的时间复杂度小于传统的K-mean算法。  相似文献   

3.
聚类是数据挖掘领域中最活跃的研究分支之一,并在其他的科学领域也有广泛的应用。设计了基于加权快速聚类的异常数据挖掘算法,以便能快速发现异常数据。首先通过对数据的每个属性赋予一定权值,权值的大小要体现其对分类的贡献度,并根据属性权值的特点,选择比较优良的初始分区,然后进行多次迭代,得到接近最优分区,接着运用一定规则,发现异常数据类,最后实践证明该技术取得很好的社会效果。  相似文献   

4.
关联规则一直都是数据挖掘的热点.近些年模糊关联规则的出现是为了解决应用传统算法挖掘数量型数据集时出现的"边界问题".本文提出先用模糊聚类的方法映射数据集,在搜索模糊频繁项集时采用升维与降维相结合的方式.  相似文献   

5.
改进的基于距离的关联规则聚类   总被引:2,自引:1,他引:1  
关联规则挖掘会产生大量的规则,为了从这些规则中识别出有用的信息,需要对规则进行有效的分类组织.现有的规则聚类方法往往直接计算规则间的距离,忽略了项与项之间的联系,不能精确得出规则间的距离.提出一种改进的规则间距离的度量方法,首先计算项间的距离,其次计算相集间的距离和规则间的距离,最后基于此距离利用DBSCAN算法对关联规则进行聚类.实验结果表明,此方法是有效可行的,并能准确发现孤立规则.  相似文献   

6.
本文主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法.以及Apfiofi算法的改进研究。  相似文献   

7.
基于聚类矩阵的入侵日志关联规则算法   总被引:1,自引:1,他引:0       下载免费PDF全文
彭剑  王小玲 《计算机工程》2010,36(22):170-172
分析已有的关联规则算法,提出一种基于聚类矩阵的入侵检测日志关联规则算法。当数据库和最小支持度发生变化时,只需扫描变动的数据即可得到新的频繁项集。实验结果表明,该算法只需扫描一次数据库,具有频繁k-项集生成速度快、节约时间等优点,能提高入侵检测日志数据库关联规则挖掘的效率,满足实时入侵检测系统的需要。  相似文献   

8.
医学数据挖掘中的数据预处理与Apriori算法改进   总被引:2,自引:0,他引:2  
医学数据挖掘是提高医院信息管理水平,为疾病的诊断和治疗提供科学的、准确的决策的需要。分析了医疗数据的特点,并以慢肺阻疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一些算法的改进措施,并用数据进行测试。结果表明,此算法优于原来算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则。  相似文献   

9.
10.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

11.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:2,他引:2  
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

12.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

13.
关联规则算法的实现与改进   总被引:11,自引:0,他引:11  
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联。在关联规则的算法中,Apriori算法是其中的关键算法之一。面对大量复杂的数据集,怎样选择数据结构,怎样优化处理过程,对于此算法的性能将会十分重要。该文首先介绍了关联规则的原理和Apriori算法的实现,然后提出了对该算法的若干改进,例如:采用树型结构存取频繁项集,使用三种缓存优化的方法等。这些优化都能够在整体上提高算法的效率。对于大数据项,试验显示,这些改进能够正确、有效、快速地实现Apriori算法。  相似文献   

14.
网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算关联权值和平均值,由此获取数据项集关联度的准确性。通过判别关联程度,完成数据预处理。采用Apriori算法对预处理后的数据进行量化处理,抽取、挖掘、记录可应用数据信息。利用亲和度函数建立目标函数,以获取隐患数据。建立关联规则,以确保隐患数据差异。以可信度结果为基础,构建网络安全隐患数据挖掘模型,实现网络安全隐患数据挖掘。试验结果表明,采用此模型后,执行时间较短、挖全率较高、数据挖掘过程中占用的内存较少。该研究可为网络安全隐患数据挖掘系统设计提供有效支持。  相似文献   

15.
时域数据的挖掘是数据挖掘领域经常遇到的问题。而时域关联规则的发现研究是关联规则的一个重要研究课题。该文在对周期关联规则进行深入研究的基础上,形式化定义了基本的时域关联规则概念,并提出了基于Apriori的发现周期关联规则的CCAR算法。CCAR的核心思想是首先把各项目按照周期时间分布进行聚类,根据聚类结果把每个项目分成几个动态的有效时间区域。在应用Apriori算法时,用项目的各个时间区域扩展项目集Ⅰ,然后根据作者提出的带时间属性的JOIN操作由Lk-1生成Ck,并由约简操作删除Ck中不满足条件的候选频繁项目集以提高算法的效率。算法理论分析和实验都表明CCAR是有效的。  相似文献   

16.
基于图的关联规则改进算法   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘研究的最重要课题之一。基于图的关联规则挖掘DLG算法通过一次扫描数据库构建关联图,然后遍历该关联图产生频繁项集,有效地提高了关联规则挖掘的性能。在分析该算法基本原理基础上,提出了一种改进的算法—DLG#。改进算法在关联图构造同时构造项集关联矩阵,在候选项集生成时结合关联图和Apriori性质对冗余项集进行剪枝,减少了候选项集数,简化了候选项集的验证。比较实验结果表明,在不同数据集和不同支持度阈值下,改进算法都能更快速的发现频繁项集,当频繁项集平均长度较大时性能提高明显。  相似文献   

17.
数据挖掘中关联规则的改进算法及其实现   总被引:8,自引:9,他引:8  
杨健兵 《微计算机信息》2006,22(21):195-197
在Apriori算法基础上,提出了基于树数据结构的关联规则改进算法。由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能。  相似文献   

18.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。  相似文献   

19.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。  相似文献   

20.
基于关联规则的二维哈希算法的改进   总被引:3,自引:2,他引:1  
张江  傅鹤岗 《计算机工程与设计》2005,26(8):2178-2179,2225
对关联规则发现中应用较多的Apriori算法进行了介绍和分析。在对Apriori算法改进的二维哈希算法中引入了新的哈希函数。这种哈希函数有效地避免了哈希“冲突”,有利于迅速产生二阶频繁项集,从而大幅度地提高了频繁项集产生的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号