共查询到20条相似文献,搜索用时 218 毫秒
1.
针对关联规则挖掘中连续属性离散化时的"尖锐边界"问题,提出了一种用直觉模糊集合理论来改进关联规则挖掘的方法,定义了直觉模糊非支持度和非置信度的概念,阐述了"支持度-非支持度-置信度-非置信度"的关联规则挖掘度量机制.描述了直觉模糊关联规则挖掘的基本原理和算法,并给出了算法的基本步骤,最后用实例验证了此算法的有效性. 相似文献
2.
针对规则随着时间变化的特点,为规则建立元规则对其支持度和置信度变化趋势的分析和预测模型。通过增加支持度向量和置信度向量这两种规则评价指标,给出了动态关联规则元规则的形式化定义。利用自回归Markov模型对动态关联规则的元规则进行了挖掘,并通过实例证明了该方法的有效性。 相似文献
3.
高置信度关联规则的挖掘 总被引:3,自引:1,他引:2
传统的关联规则和基于效用的关联规则,会忽略一些支持度或效用值不高、置信度(又称可信度)却非常高的规则,这些置信度很高的规则能帮助人们满足规避风险、提高成功率的期望。为挖掘这些低支持度(或效用值)、高置信度的规则,提出了HCARM算法。HCARM采用了划分的方法来处理大数据集,利用新的剪枝策略压缩搜索空间。同时,通过设定长度阈值minlen,使HCARM适合长模式挖掘。实验结果表明,该方法对高置信度长模式有效。 相似文献
4.
传统的正关联规则考虑的是事务中所列举的项目,而负关联规则不仅考虑事务中所包含的项,还考虑了数据库中存在而事务中所不包含的项。该文首先讨论了负关联规则的相关定义,以及它的支持度、置信度与相关度,并分析了PNARC模型的算法。最后对负关联规则的研究发展方向进行分析。 相似文献
5.
6.
7.
在不完备信息系统中挖掘关联规则是一个重要课题。利用粗糙集处理不确定、不完全数据的优势,本文重新定义了关联规则的支持度和置信度,做到不处理缺失数据,直接提取带结论的关联规则。实例表明,所获得的规则简洁与缺失值无关。 相似文献
8.
《计算机科学与探索》2016,(11):1546-1554
通过研究基于经典概念格的关联规则提取算法,结合区间概念格的概念性质和结构特性,提出了一种带参数的区间关联规则提取模型,以解决不确定规则的挖掘问题。首先给出了区间规则挖掘过程中的一系列定义和相关定理,并基于区间概念的不确定性,定义了区间关联规则的度量标准——精度和不确定度;之后构建了基于区间概念格的带参数规则挖掘模型,分析表明模型能提取具有较高支持度和置信度的关联规则,提高了规则的可靠性;最后用图书推荐的实例验证了模型的可行性,同时研究了区间参数α和β对区间关联规则的影响。 相似文献
9.
10.
目前衡量和生成关联规则的主要准则是考虑支持度和置信度阈值,而在实际应用中仅按此准则来挖掘是不够的, 这主要是因为关联规则的评价标准不合理产生的. 针对关联规则评价指标进行了深入的研究, 分析了“支持度-置信度”架构的局限性, 提出了基于相关性的兴趣度的评价指标PS公式, 根据其数学特性指出了它的优点与不足, 为关联规则评价体系的改进奠定了理论基础. 相似文献
11.
Two parameters, namely support and confidence, in association rule mining, are used to arrange association rules in either
increasing or decreasing order. These two parameters are assigned values by counting the number of transactions satisfying
the rule without considering user perspective. Hence, an association rule, with low values of support and confidence, but
meaningful to the user, does not receive the same importance as is perceived by the user. Reflecting user perspective is of
paramount importance in light of improving user satisfaction for a given recommendation system. In this paper, we propose
a model and an algorithm to extract association rules, meaningful to a user, with an ad-hoc support and confidence by allowing
the user to specify the importance of each transaction. In addition, we apply the characteristics of a concept lattice, a
core data structure of Formal Concept Analysis (FCA) to reflect subsumption relation of association rules when assigning the
priority to each rule. Finally, we describe experiment results to verify the potential and efficiency of the proposed method. 相似文献
12.
相关测度与增量式支持度和信任度的计算 总被引:5,自引:0,他引:5
通过相关测度的定义,从理论上探讨了增量式规则发现问题,并把分类规则挖掘和关联规则挖掘联系起来进行研究,为该问题的深入研究奠定了理论基础.相关测度刻画了给定关系和相关集合的数字特征.对相关测度的概念、定义、性质以及与支持度和信任度的关系等方面作了详细的分析和探讨,给出了基于相关集合的支持度和信任度的定义及计算方法.证明了测度增量定理和支持度增量定理,并给出了增量式支持度和信任度的计算公式.另外还详细地分析了数据增量对关联规则和信任度的影响,探讨了基于新支持度的候选项的修剪问题.所提出的相关测度及其思想为研究既能用于分类规则又能用于关联规则的统一数据挖掘方法提供了有价值的新思路. 相似文献
13.
14.
15.
针对传统正负关联规则置信度阈值设置方法难以控制低可信度规则数量和易遗漏有趣规则的问题,提出了一个结合项集相关性的两级置信度阈值设置方法(PNMC-TWO)。首先,基于规则的无矛盾性、有效性和有趣性考虑,以相关度-支持度-置信度为框架,从规则置信度与项集支持度的计算关系出发,系统地分析了正负关联规则置信度取值随规则的项集支持度大小变化的规律;然后,与实际挖掘中用户对高可信度且有趣的规则需求相结合,提出了一个新的设置模型,避免了传统方法设置阈值时的盲目性和随意性;最后,从规则数量和规则质量两方面对所提方法与原双阈值法进行了实验对比。实验结果表明,所提方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显著地降低可信度低的关联规则数量。 相似文献
16.
基于Apriori的有效关联规则挖掘算法的研究 总被引:29,自引:0,他引:29
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。 相似文献
17.
关联规则挖掘是数据挖掘领域非常重要的课题,在很多领域被广泛应用。关联规则挖掘算法都需要设置最小支持度和最小置信度。很多国内外学者研究的挖掘算法在这两方面都存在着一些问题,不仅需要大量的领域知识来设置合适的最小支持度,而且其结果集庞大、用户不容易理解。针对关联规则挖掘算法存在的问题,将命题逻辑融合到关联规则算法Eclat中,设计出了基于命题逻辑思想的挖掘算法L-Eclat。实验结果表明,L-Eclat算法压缩了挖掘的规则集,减小了算法的时间消耗,且即使是非常小的支持度也可以得到高质量的关联规则,这在一定程度上解决了支持度设置的问题。 相似文献
18.
Wei-Min Ma Ke Wang Zhu-Ping Liu 《Soft Computing - A Fusion of Foundations, Methodologies and Applications》2011,15(6):1173-1182
The association rules, discovered by traditional support–confidence based algorithms, provide us with concise statements of
potentially useful information hidden in databases. However, only considering the constraints of minimum support and minimum
confidence is far from satisfying in many cases. In this paper, we propose a fuzzy method to formulate how interesting an
association rule may be. It is indicated by the membership values belonging to two fuzzy sets (i.e., the stronger rule set
and the weaker rule set), and thus provides much more flexibility than traditional methods to discover some potentially more
interesting association rules. Furthermore, revised algorithms based on Apriori algorithm and matrix structure are designed
under this framework. 相似文献
19.
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。 相似文献
20.
一条关联规则是有趣的如果它满足最小支持度和可信度的限制.这导致大量平凡的规则产生.设计一个算法挖掘这样的有趣规则,它的前件和后件分别属于不同的概念类,称这种规则为类间桥.类间桥在行销中的交叉销售,生物工程中的嫁接,化学中的合成等应用中有重要的应用价值. 相似文献