共查询到20条相似文献,搜索用时 15 毫秒
1.
基于频繁集的多层次交互式关联规则挖掘 总被引:2,自引:1,他引:1
文章研究了一种知识发现与数据挖掘中关联规则的发现方法,针对现有大型超市销售事务数据库,提出了一种新的多层次信息获得取方法。运用关联规则挖掘所产生的频繁集对数据压缩表示,并给出了按用户的实际需求交互式挖掘感兴趣关联规则的算法。该算法在挖掘速度和效率上有较大提高。 相似文献
2.
3.
随着信息技术和数据库技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。提出了一种基于矩阵的模糊关联规则挖掘算法,并将其应用于网络安全事件关联分析中,通过对DARPA标准数据集的分析,得出了预期数量的关联规则,并成功验证了某些攻击场景,该模糊关联规则挖掘算法取得了较好的实验结果。 相似文献
4.
讨论了一个关于布尔关联规则挖掘的不产生候选项集的挖掘算法 ,做了一些提高算法性能的改进 ,并对其性能进行了测试。 相似文献
5.
基于项集特性的关联规则挖掘中Apriori算法的改进 总被引:2,自引:0,他引:2
提出一个改进Apriori的算法IApr,利用事务数据库的事务数相对于项集的项的个数而言要大得多这一特点,采用线性存储结构,并结合推出并证明的项集特性,考虑候选频繁项目集的各个项的应满足的条件,只需扫描一次事务数据库,有效减少了生成候选频繁项集的数目,从数据扫描量、搜索空间、时间复杂度上分析都提高了算法效率。 相似文献
6.
本文提出了改进关联挖掘算法的数据挖掘方式.在自然连接产生候选集以前,先进行一个修剪过程,减少参加连接的项集数量,进而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,避免传统方法的弊端.仿真实验证明,这种改进算法能够大幅提高数据的查询速度,取得很好的效果. 相似文献
7.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。 相似文献
8.
针对属性粒度模糊划分需事先给定与Aprirori算法效率低的问题,提出基于自动模糊划分和改进Apriori算法的QAR关联规则生成方法。首先对QAR数据进行空缺值填补等预处理;然后给出最佳聚类准则并根据给出的最佳聚类准则得到最佳聚类,从而对QAR属性完成自动模糊划分及隶属函数的确定;之后通过记录数据项位置及简化连接与剪枝过程来提高Apriori算法的效率;并将其应用到QAR关联规则的生成过程;最后通过品质和性能度量两方面的实验,表明此方法在各方面的性能均优于经典方法。 相似文献
9.
基于PSO的关联规则挖掘方法及应用 总被引:1,自引:0,他引:1
本文简要描述了关联规则问题及二进制粒子群优化算法(Binary Particle Swarm Optimization,BPSO),提出了一种基于粒子群优化算法的关联规则挖掘算法.仿真试验研究了关联规则在股市走势中的应用,选取相对强弱指标RSI,收集交易数据进行实证分析,得出若干条有用的关联规则. 相似文献
10.
11.
12.
介绍了关联规则数据挖掘概念和可拓学思想。探讨了把可拓学理论用于关系数据库上关联规则挖掘。通过对关系数据库上多值属性进行布尔数值转换,利用关联规则挖掘算法在关系数据库对关联规则进行挖掘.再用可拓学相关性和蕴含性思想,对所获得的关联规则进行拓展,获得更多更有价值的关联规则。 相似文献
13.
14.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。 相似文献
15.
遗传算法在Web关联挖掘中的应用研究 总被引:2,自引:1,他引:2
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。 相似文献
16.
具有语义最小支持度的关联规则挖掘方法 总被引:1,自引:0,他引:1
现有的关联规则挖掘方法中,大多采用单一的最小支持度.实际上,应该根据数据的特点设置不同的最小支持度.文中针对这一问题,将语义信息引入关联规则挖掘之中,提出了具有语义最小支持度的关联规则挖掘方法.该方法首先计算项目之间的语义相关度,然后根据候选集的语义相关度对候选集合进行过滤,最后根据候选集的语义相关度,确定其语义最小支持度.实验表明:具有语义最小支持度的关联规则挖掘方法比传统的关联规则挖掘方法能够更好地实现关联规则的挖掘. 相似文献
17.
刘丽峰 《微电子学与计算机》2012,29(5):174-177
充分研究新型的数据前期预处理及金融数据联系的一些时间变量的预处理方法,提出一种基于清洗关联规则的金融数据挖掘算法.引入关联规则的分析在一定支持度的约束下研究和金融紧密相关的一些因素,在应用过程中随着算法的开展,对重点部门与重点功能进行观测与预警.实验证明,该方法可以更加准确的进行金融数据状态的跟踪,挖掘效率更高. 相似文献
18.
针对关联规则挖掘中的高效更新问题,对增量和负增量问题进行了讨论,提出当最小支持度发生变化时可归结为数据库发生变化的情形进行讨论。采用十字链表来分别存储原数据库DB和变化数据库db中,各频繁项集及其支持度s1和s2,通过对s1,s2及最小支持度s0的比较分析,判断项集是否为频繁项集,减少了扫描数据库的次数,提高了更新后的... 相似文献
19.
提出了一种有效的增量式关联规则挖掘算法IAR,算法的特点在于:提出并采用了基于候选项集个数上阶的选择扫描数据库的机制,可有效减少数据库的扫描次数;算法是一种通用的增量式算法,提出了最小支持度和数据库均改变时,增量式挖掘中的重要性质,从而可充分利用上一次挖掘的结果,有效减少候选项集的数目.并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法.通过大量的数据实验,表明算法的效率比已有的算法有了很大提高. 相似文献
20.
CR:一种逆向的关联规则挖掘算法 总被引:4,自引:0,他引:4
引入与交易相关的有关概念,对传统关联规则挖掘的概念进行了扩展,并基于交易提出了一种关联规则挖掘算法,该算法从较长的交易入手,试图找出长的频繁项集,再确定它们的子项集,从而避免了组合爆炸问题。该算法对原数据库进行1次扫描,对压缩数据库进行了2次扫描,较Apriori算法减少了扫描次数,提高了挖掘效率。 相似文献