共查询到19条相似文献,搜索用时 56 毫秒
1.
2.
一个最优分类关联规则算法 总被引:1,自引:0,他引:1
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。 相似文献
3.
4.
基于Apriori 分类事务库关联规则算法 总被引:2,自引:1,他引:2
Apriori 算法是通过定义的事务库来生成频繁项集,确定各数据之间的关联规则。在实际应用中生成事务库时常常会出现同一项目中重复类型的事务库,而同一项目的事务之间的支持度为零。因此,事务库的定义方法是直接影响生成关联规则的生成速度与效率,针对这一问题,本文提出并实现了一种基于Apriori 分类事务库的关联规则算法。该方法改变了传统Apriori 算法中所有事务统一定义的方法,对不同项目的事务进行分类定义,通过这种的实现,不但减少了计算机的大量运算,而且提高了关联规则的生成速度。 相似文献
5.
基于关联规则的Web文档分类 总被引:5,自引:2,他引:5
在现有的Web文档分类器中,有的分类器产生比较精确的分类结果,有的分类器产生更易解释的分类模型,但还没有分类器可以将两个方面的优点结合起来.有鉴于此,论文提出一种基于关联规则的Web文档分类方法.该方法采用事务概念,主要考虑两方面的问题:①在文档训练集中发现最优的词条关联规则;②用这些规则构建一个Web文档分类器.试验表明该分类器性能良好,训练速度快,产生的规则易于被人理解,而且容易更新和调整. 相似文献
6.
刘红梅 《数字社区&智能家居》2009,(3)
分析、比较了当前具有代表性的分类关联算法,总结了关联规则分类存在的问题,便于使用者根据需要选择合适的算法,也便于研究者对算法进行研究改进,提出性能更好的分类算法。 相似文献
7.
基于模糊分类关联规则的分类系统 总被引:9,自引:0,他引:9
为了构建高性能的分类系统,应用模糊集软化数量型属性的划分边界,提出了模糊分类关联规则的挖掘算法。由于模糊集能很好地贴近人类的思维方式,因此挖掘得到的模糊分类关联规则易于被人理解.接着提出了基于模糊分类关联规则的分类系统,并采用遗传优化算法训练分类系统.实例分析的结果表明,基于模糊分类关联规则的分类系统具有较好的精度和可解释性. 相似文献
8.
关联分类具有较高的分类精度和较强的适应性,然而由于分类器是由一组高置信度的规则构成,有时会存在过度拟合问题。提出了基于规则兴趣度的关联分类(ACIR)。它扩展了TD-FP-growth算法,使之有效地挖掘训练集,产生满足最小支持度和最小置信度的有趣的规则。通过剪枝选择一个小规则集构造分类器。在规则剪枝过程中,采用规则兴趣度来评价规则的质量,综合考虑规则的预测精度和规则中项的兴趣度。实验结果表明该方法在分类精度上优于See5、CBA和CMAR,并且具有较好的可理解性和扩展性。 相似文献
9.
随着电子商务的不断发展,对用户的分析和分类越来越重要,因此需要一个行之有效的方法来对用户进行分类。针对网站日志数据的特点和各种数据挖掘算法的应用特征,尝试用基于关联规则的分类算法来对网站客户进行分类。实验证明此方法是有效的,其结果可以作为提供个性化服务的依据。 相似文献
10.
关联分类是数据挖掘及机器学习领域的一个研究热点。利用原子关联分类算法(CAAR)建立了数据模型的机器学习系统,详细说明了CAAR 算法的分类步骤并给出了算法的伪代码表示。在UCI 提供的标准数据集上进行测试,实验验证了在大规模数据集中,在不同的抽样率情况下,原子关联分类算法的分类准确度,用数据的方式与其他分类算法做了比较。对数据集记录次序的依赖性进行的10-折交叉验证实验表明,原子关联分类算法的分类准确度要高于CBA 算法。 相似文献
11.
关联规则和分类规则挖掘算法的改进与实现 总被引:5,自引:0,他引:5
对Apriori关联规则挖掘算法提出了一种改进方法,使其可以有效地压缩数据规模,提高了原Apriori算法的执行效率。此外,还对OCI分类规则挖掘算法提出了改进,扩展了该算法的适用范围。同时,该采用这两个改进算法实现了一个数据挖掘原型系统。 相似文献
12.
13.
基于最大关联规则的文本分类 总被引:1,自引:0,他引:1
我们提出了一种新颖的、基于最大关联的文本分类方法—SAT-MOD 。在文本分类中,以往的方法在挖掘频繁项集和关联规则的时候,往往是将整个文本看作一个事务来处理的,然而文本的基本的语义单元实际上是句子。那些同时出现在一个句子里的一组单词比仅仅是同时出现在同一篇文档中的一组单词有更强的语义上的联系。基于以上的考虑,SAT-MOD 把一篇文档里的某些句子作为一个单独的事务。通过在标准的文本集上的大量实验,证明了SAT-MOD 的有效性。 相似文献
14.
传统的Apriori关联法则算法必须经过大量反复的数据库扫描才能产生候选项集,效率较低.提出一个改进的CBA(Classification Based Apriori)算法.此算法仅需扫描数据库一次,将数据库经过预处理后,再将事务数据库进行分类并保存分类结果,比较时可以不与所有事务记录进行比较,从而减少扫描数据库的次数与比较时间,且又能确保挖掘结果的完整性与正确性. 相似文献
15.
基于综合度量的关联规则挖掘算法 总被引:2,自引:0,他引:2
从确定性,有用性,简洁性和新奇性4个方面对规则进行综合度量,给出了规则长度和兴趣度约束的定义,在传统算法基础上提出了基于综合度量的关联规则挖掘算法,使关联规则的挖掘质量得到提高。 相似文献
16.
提出了一种新的基于模糊概念的量化关联规则挖掘方法,该方法利用在量化属性域上定义的一组模糊概念表示属性间的关联关系,克服了传统的离散分区法的不足,使得规则的表示自然,简明,有利于专家理解,同时,给出了挖掘算法。 相似文献
17.
关联规则挖掘与分类规则挖掘的比较研究 总被引:1,自引:0,他引:1
关联规则挖掘与分类规则挖掘都是数据挖掘,领域中很重要的技术。本文首先简要介绍了关联规则挖掘和分类规则挖掘的基本知识,主要从挖掘目的、发现规则算法的方法、算法的设计思想等几个方面对它们进行了比较,最后介绍了它们之间的联系。 相似文献
18.
基于Apriori算法的水平加权关联规则挖掘 总被引:19,自引:2,他引:19
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此有必要加强这些项目对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的项目对规则的影响。为此,论文提出了水平加权关联规则的问题,并结合Apriori算法,加以改进,给出了关于该问题的解决方案及有效算法New_Apriori。 相似文献