共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
3.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
4.
本文提出一种传统的关联规则挖掘主要着眼于正关联规则,即形如A→B的规则的挖掘,而对负关联规则的研究非常有限,然而实践表明在关联规则的各个应用领域中,负关联规则同正关联规则有着同样的重要性。Apriori算法是挖掘关联规则的一个经典算法,但是它只局限于挖掘正关联规则,本文对该算法进行改进提出了Ex-Apriori算法,新算法不仅能挖出负关联规则,而且由于兴趣度的引进,能够剔除大量无趣的关联规则。实验表明该种算法有效且可行。 相似文献
5.
6.
基于最小提升率的正负关联规则挖掘 总被引:3,自引:0,他引:3
给出了提升率的概念,并阐述了提升率的意义和作用。提出了基于支持度一提升率的正负关联规则挖掘模式。实验表明,采用该模式进行正负关联规则挖掘,所挖掘出的规则数量少,质量高,无虚假规则和相互矛盾的规则。 相似文献
7.
8.
李佐军 《数字社区&智能家居》2014,(6):1223-1226
通过查阅相关文献资料,收集整理了基于概率兴趣度模型、差异思想兴趣度模型、相关性兴趣度模型、信息量兴趣度模型、影响兴趣度模型的计算公式,并利用Visual FoxPro编程语言实现这些兴趣度模型的关联规则挖掘算法。通过实验分析了各种兴趣度模型的取值与规则显示间的关系,并简要分析总结了各种兴趣度模型的基本特点。 相似文献
9.
10.
基于统计相关性的兴趣关联规则的挖掘 总被引:8,自引:0,他引:8
本文首先对关联规则的支持—置信框架存在的不足进行了分析,然后引入了规则的兴趣度概念,利用兴趣度来约束冗余关联规则的产生,以提高挖掘知识的有用性,并给出了算法描述。 相似文献
11.
传统关联规则挖掘是在整个事务数据库的时间范围内进行的,但有时用户想得到某一特定时间范围(如商品的促销阶段)内的关联规则,该文对这一问题进行了详细讨论,提出了基于定制时间的时态支持度、时态频繁项集、时态置信度、时态关联规则等概念,在传统Apriori算法的基础上提出了挖掘时态频繁项集的算法。另一方面,讨论了当同时考虑正、负关联规则出现的矛盾规则问题以及用相关性解决这一问题的方法,提出了挖掘正负时态关联规则的算法,实例说明了算法的执行过程及有效性。 相似文献
12.
13.
14.
一种改进的正负关联规则挖掘算法 总被引:1,自引:0,他引:1
针对传统正负关联规则挖掘算法需要多次扫描数据库并且生成大量候选频繁项集的问题,在对比目前相关研究成果的基础上,提出了一种改进的正负关联规则挖掘算法,它通过两次数据扫描完成对正负关联规则的挖掘,对最大频繁项集的挖掘算法做了改进,有效提高了算法效率,同时对置信度标准做了改进。基于某真实事务集的实验表明,算法提高了规则挖掘的质量和有效性。 相似文献
15.
兴趣度量在关联规则挖掘中常用来发现那些潜在的令人感兴趣的模式,基于FP树结构的FP-growth算法是目前较高效的关联规则挖掘算法之一,如果挖掘潜在的有价值的低支持度模式,这种算法效率较低。为此,本文提出一种新的兴趣度量—项项正相关兴趣度量,该量度具有良好的反单调性,所得到的模式中任意一项在事务中的出现均可提升模式中其余项出现的可能性。同时,提出一种改进的FP挖掘算法,该算法采用一种压缩的FP树结构,并利用非递归调用方法来减少挖掘中建立额外条件模式树的开销。更为重要的是,在频繁项集挖掘中引入项项正相关兴趣度量剪枝策略,有效过滤掉非正相关长模式和无效项集,扩大了可挖掘支持度阈值范围。实验结果表明,该算法是有效和可行的。 相似文献
16.
纪怀猛 《计算机与数字工程》2012,40(6):148-150
如何根据用户当前的访问行为,预测他下一个感兴趣的商品,做出针对性的推荐成为电子商务的一个重要研究内容。文章提出了一种不需产生大量非频繁项集的关联规则挖掘算法,该算法利用相关性很好的改善了经典Apriori算法中存在大量冗余规则问题。最后通过实验证明了算法的有效性。 相似文献
17.
多数据库中全局负关联规则挖掘研究 总被引:1,自引:0,他引:1
全局负关联规则挖掘是多数据库关联信息挖掘的重要研究内容,具有广泛的应用范围和使用价值.合并各子数据库的负关联规则是现有全局负关联规则挖掘常用的方法,但数据密度大、规则不全面及运算时间高等问题影响了已有全局负关联规则挖掘方法的效率.本文给出一种新的全局负关联规则挖掘算法,其具体步骤为:(1)扫描各子数据库,建立多数据库频繁模式树;(2)依据频繁项集全局一致性原则,对多数据库频繁模式树执行精简操作;(3)在此基础上产生全局极小非频繁项集;(4)依据极大频繁项集向上闭包原则,产生全局非频繁项集;(5)在规则相关度的基础上提取全局负关联规则.大量的对比实验结果表明,本文算法具有快速发现全局负关联规则的能力. 相似文献
18.
挖掘支持度和兴趣度最优的数量关联规则 总被引:4,自引:0,他引:4
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题,给出了数量关联规则的客观兴趣度的度量函数,提出用模板匹配方法挖掘用户感兴趣的规则,以解决数量关联规则有趣性的主观评测,研究了一种挖掘支持度和兴趣度最优的形如(A∈[v1,v2]∧)C1)推出C2(其中A为连续属性,C1、C2为类别属性)的数量关联规则方法,并将该方法应用于股市行情分析,实验结果表明是非常有效的. 相似文献
19.
20.
目前衡量和生成关联规则的主要准则是考虑支持度和置信度阈值,而在实际应用中仅按此准则来挖掘是不够的, 这主要是因为关联规则的评价标准不合理产生的. 针对关联规则评价指标进行了深入的研究, 分析了“支持度-置信度”架构的局限性, 提出了基于相关性的兴趣度的评价指标PS公式, 根据其数学特性指出了它的优点与不足, 为关联规则评价体系的改进奠定了理论基础. 相似文献