首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
无候选项的频繁邻近类别集挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有的频繁邻近类别集挖掘算法因产生候选项而存在冗余计算,提出一种无候选项的频繁邻近类别集挖掘算法,其适合在海量数据中挖掘空间对象的频繁邻近类别集;该算法以交叉搜索方式,用产生邻近类别集非空真子集的方法来计算支持数,实现一次扫描数据库挖掘频繁邻近类别集。算法无需产生候选频繁邻近类别集,且计算支持数时无需重复扫描数据库,达到了提高挖掘效率的目的。实验结果表明其在海量空间数据中挖掘频繁邻近类别集时,该算法比现有算法更快速更有效。  相似文献   

2.
在频繁邻近类别集挖掘中,由于用户指定约束条件的动态变化,现有挖掘算法因多次重复扫描空间事务而存在冗余计算,故提出一种频繁邻近类别集的动态约束挖掘算法,其能根据用户发出的动态约束指令,提取满足用户需求的频繁邻近类别集;该算法用数组索引映射邻近类别集,用正整数幂集法计算支持数和搜索满足用户动态约束的频繁邻近类别集;该算法无需产生候选频繁邻近类别集且不重复扫描缓冲分析得到的空间事务;为了验证算法的实用性和高效性,将其应用到移动环境中缩短移动系统的响应时间,尽最大努力来提高用户满意度,通过移动计算下的仿真实验表明该算法比现有算法更快速更有效。  相似文献   

3.
方刚  熊江 《计算机工程》2011,37(13):58-60
在空间数据库中挖掘带约束条件的频繁邻近类别集时,使用传统约束性关联规则的挖掘算法存在冗余候选项和重复计算等问题。为此,提出一种带约束条件的频繁邻近类别集挖掘算法,该算法以邻近类别集标识值双向变化的方法产生候选频繁邻近类别集,通过标识值的“与”运算计算支持数,达到提高算法挖掘效率的目的。实验结果表明,该算法比现有算法更简单快速。  相似文献   

4.
方刚 《计算机工程》2012,38(11):62-65
在幂集理论的基础上,引入约束幂集概念,提出一种依赖于约束幂集的频繁邻近类别集(NCS)挖掘算法。该算法采用计算约束幂集映射的方法,生成候选频繁NCS并计算支持数,使其能避免冗余候选项的产生以及减少对数据库的重复扫描次数。实验结果表明,该算法在挖掘约束频繁NCS时比现有挖掘算法更快速有效。  相似文献   

5.
方刚  应宏  熊江  吴元斌 《计算机工程》2010,36(19):87-89
针对现有挖掘算法不能有效提取空间拓扑关联的问题,提出一种交替搜索空间拓扑关联的挖掘算法,适合在海量空间数据中挖掘空间拓扑关联规则。该算法从候选数字区间的两端,用数字递增和递减2种方式产生候选频繁项,实现交替搜索空间拓扑关联规则。在计算支持数时用数字特征减少被扫描的事务数,达到提高挖掘效率的目的。实验结果表明,在空间数据中挖掘空间拓扑关联规则时,该算法比现有算法更快速、有效。  相似文献   

6.
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。  相似文献   

7.
挖掘频繁项目集是关联规则应用中的关键问题.目前挖掘频繁集主要有Apriori算法和频繁树法两大类.本文提出与上述两类算法完全不同的高效挖掘最大频繁集的算法:最小支持数最小组合算法(MSMCA).该算法不产生候选频繁集,能较大减少计算量的开销.此外,在此算法的研究中,本文提出另一个子课题:重复数列中最小支持数最小组合算法研究.  相似文献   

8.
空间拓扑关联的双向挖掘研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有挖掘算法不能快速地提取空间拓扑关联,提出一种空间拓扑关联的双向挖掘算法,其适合在海量空间数据中挖掘空间拓扑关联规则;该算法用二进制数表示空间拓扑元,并用其位运算,按自顶向下和自底向上两种方式计算产生候选频繁项,实现双向搜索空间拓扑关联规则;算法在计算支持数时还用数字式空间事务的特性减少被扫描的事务数,达到提高挖掘效率的目的。实验结果表明在空间数据中挖掘空间拓扑关联规则时,该算法比现有算法更快速更有效。  相似文献   

9.
将二进制引入关联规则求解中,充分利用二进制操作方便、运算速度快、节省空间的优势.在求解事务项集真子集和支持度时,对事务数据库中相同事务只求解一次,并给出了真子集的具体求解算法.本算法一次扫描数据库可以挖掘出所有频繁集,而且可以根据需求对最小支持度和最小置信度进行修改,修改后不需要再次扫描数据库即可求出频繁项集,大大提高了挖掘效率.  相似文献   

10.
针对现有频繁闭项目集挖掘算法存在的不足,提出了一种基于粒度计算的频繁闭项目集挖掘算法。通过混合进制数的变化来生成候选项目集,避免使用了复杂的数据结构,减少了内存和CPU的开销;利用粒度计算的分而治之思想来计算频繁闭项目集的支持度,避免了多次重复扫描数据库,减少了计算复杂度和I/O开销。实验结果表明该算法比经典的频繁闭项目集挖掘算法快速而有效。  相似文献   

11.
在挖掘空间拓扑关联规则时,由于现有挖掘算法不能够提取满足用户特定需求的空间拓扑关联规则,若使用传统约束性关联规则挖掘算法,则存在大量的重复计算和冗余候选项;提出一种面向用户的空间拓扑关联规则挖掘算法,其适合在多空间关系模式下,挖掘满足用户特定需求的拓扑关联。该算法通过拓扑关系编码法将空间关系事务转换成整数,用非目标自由空间对象类的集合序列数值递增的方法,索引构建候选频繁项,并用布尔运算计算支持数。在挖掘满足用户特定需求的空间拓扑关联规则时,该算法是快速而有效的。  相似文献   

12.
基于FP-T ree的FP-M ax算法在挖掘最大频繁集时需多次递归建立条件模式树耗费大量存储空间,这大大降低了算法的挖掘效率。提出了一种基于改进FP-T ree的最大频繁集快速挖掘算法-FP-EM ax算法。该算法无需建立条件模式库大大减少了存储空间开销,采用预剪枝策略减少条件模式树的构造次数及子集检测次数,从而算法的挖掘效率大大提高。最后通过实验证明FP-EM ax算法在支持度较小的情况下较之于FP-M ax及同类算法具有更好的性能。  相似文献   

13.
在目前的移动智能系统中,由于使用现有挖掘算法存在大量的冗余候选项和重复计算量,制约着移动系统效率的提高;故提出一种基于事务支持项分离的拓扑关联规则挖掘算法,其适合在移动计算的多空间关系模式下,提取复杂的拓扑关联规则;该算法通过事务支持项分离法和上行搜索法,计算出空间拓扑关联规则,为移动用户提供决策支持;算法无需产生候选项和计算支持数;在仿真实验中,根据用户提供的不同支持度,与同类算法比较运行时间,实验结果表明其比现有算法快速而有效。  相似文献   

14.
针对经典频繁模式挖掘算法存在的不足,提出了一种基于复合粒度计算的频繁模式挖掘算法。该算法借助复合粒度计算方法双向搜索频繁模式,即首先通过二进制的按位取反运算获得复合粒度内涵的像,然后构建复合粒度计算发现频繁模式;虽然该算法需要产生候选项,但它只需扫描一次数据库,减少了I/O开销;算法通过线性数组存储复合信息粒度减少内存使用。理论分析和实验比较表明,其效率优于经典的频繁模式挖掘算法,且内存利用率比较高。  相似文献   

15.
在提取满足用户特定需求的关联规则时,由于现有约束性关联规则挖掘算法存在大量的冗余候选项和重复计算,故提出一种基于属性位复用的约束性关联规则挖掘算法,其适合挖掘任何长度且满足用户特定需求的关联规则。该算法通过属性位的权值组合,将交易事务转换成整数,用属性位复用技术构建候选区间,并利用其端点值双向变化,构建索引候选频繁项,同时也用布尔运算计算其支持数。实验证明其比现有算法更快速,将其应用到客户关系管理系统中分析客户关联信息,可以有效地提高系统效率。  相似文献   

16.
关联规则挖掘是数据挖掘领域中最活跃的一个分支。目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率。针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法。以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式。使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号