首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 932 毫秒
1.
《计算机工程与科学》2017,(10):1966-1970
基于支持度-置信度的关联分类是一项重要的分类算法,这种关联分类算法先构建频繁项集,然后通过置信度的阈值来选取规则,容易产生质量不高的规则。针对这个问题,提出了一种改进关联分类算法:首先,选取大量的属性值对建立起条件小训练集;其次,每条规则主体通过选取条件小训练集中最好属性值对连接生成;最后,采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。在25个UCI数据集上的实验结果表明,所提出的改进关联分类算法的准确率得到了显著提高。  相似文献   

2.
规则式分类器通常使用单一度量选择属性值,然而单一度量会导致很多属性值具有相同的度量值,从而无法选择出"好"的属性值。此外,规则式分类器通常提取置信度为100%的规则,致使规则提取过程比较费时,并且所得到的规则支持度较低。针对上述不足,提出新的属性值度量——选择度。选择度是基于信息熵、类支持度及偏离度3种度量的结合,能更好地区分属性值的优劣。在此基础上,提出一种基于选择度的分类规则学习算法LRSM。在LRSM算法中,当规则包含的负实例数小于给定域值时,该规则被抽取,删除被此规则覆盖的实例,抽取下一条规则。实验结果表明,与FOIL算法相比较,LRSM算法提高了分类准确率,同时明显地减少了分类所消耗的时间。  相似文献   

3.
关联分类通常产生大量的分类规则,导致在分类新实例时经常产生规则冲突问题。针对这种规则冲突问题,提出了一种基于改进关联分类的两次学习框架。利用频繁且互关联的项集产生分类规则改进关联分类算法,有效减少了规则数。应用改进的关联分类算法产生的一级规则一次性分离出训练集中规则冲突的所有实例。然后,在冲突实例上应用改进的关联分类算法进行第二次学习得到二级规则。分类新实例时,首先利用第一级规则进行分类。如果出现规则冲突,则利用第二级规则分类该实例。实验结果表明,基于改进关联分类的两次学习方法降低了规则冲突比率,并且显著提高了分类准确率。  相似文献   

4.
针对化学数据分类的问题,提出一种用于挖掘化学模式分类提取规则的遗传算法.该算法以样本属性值为条件,采用实值编码方式,将化学分类提取规则演绎成种群进化规则,适应度函数与各参数的设置也以离散型化学数据和连续型化学数据的规则提取为依据.实验结果表明,设计的遗传算法在解决化学模式分类问题上性能良好,易于专业分析.  相似文献   

5.
关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的主要特点是:(1)根据训练集中各类数量大小给出每个类类支持度阈值的设定方法,并基于各类的类支持度阈值独立挖掘该类的关联分类规则,尽量使小类生成更多高置信度的规则;(2)采用类支持度对置信度相同的规则排序,提高小类规则的优先级;(3)用综合考虑置信度和提升度的新的规则度量预测未知实例。在多个数据集上的实验结果表明,相比多种关联分类改进算法,ACCS算法有更高的整体分类准确率,且在不平衡数据上也能取得较好的小类分类性能。  相似文献   

6.
分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法.它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同的子集作为停机条件,实现连续属性样本分类规则挖掘的完全自动化.它考虑到数据挖掘的目标和要求,充分利用属性与类间的依赖性、属性间的互补性,达到样本分割点数少、分类规则简单和属性约减的目的.最后通过实例进行了验证,并与C4.5算法进行了比较.  相似文献   

7.
基于排序的关联分类算法   总被引:1,自引:0,他引:1  
提出了一种基于排序的关联分类算法.利用基于规则的分类方法中择优方法偏爱高精度规则的思想和考虑尽可能多的规则,改进了CBA(Classification Based on Associations)只根据少数几条覆盖训练集的规则构造分类器的片面性.首先采用关联规则挖掘算法产生后件为类标号的关联规则,然后根据长度、置信度、支持度和提升度等对规则进行排序,并在排序时删除对分类结果没有影响的规则.排序后的规则加上一个默认分类便构成最终的分类器.选用20个UCI公共数据集的实验结果表明,提出的算法比CBA具有更高的平均分类精度.  相似文献   

8.
在基本人工鱼群算法的基础之上构建了用于解决连续变量空间分类规则提取的多群体人工鱼群算法,根据分类规则提取问题的特性设计了人工鱼的编码规则,并在此编码基础上定义了进行规则评价的适应值函数以及相关状态更新公式。为克服人工鱼群算法易陷入局部最优解的缺陷,引入了遗传算法中的交叉变异思想,设计了基于人工鱼的交叉及变异算子,提出了利用多种群交叉变异人工鱼群算法生成分类规则的算法思想。利用Iris和Wine数据集作为测试数据,结果表明:(1)该算法能够快速生成精度较高的分类规则;(2)在收敛效率及规则精度上全面优于基本多群体人工鱼群算法,并达到了多群体微粒群算法的性能水平。  相似文献   

9.
基于关联规则的Web文档分类   总被引:5,自引:2,他引:5  
在现有的Web文档分类器中,有的分类器产生比较精确的分类结果,有的分类器产生更易解释的分类模型,但还没有分类器可以将两个方面的优点结合起来.有鉴于此,论文提出一种基于关联规则的Web文档分类方法.该方法采用事务概念,主要考虑两方面的问题:①在文档训练集中发现最优的词条关联规则;②用这些规则构建一个Web文档分类器.试验表明该分类器性能良好,训练速度快,产生的规则易于被人理解,而且容易更新和调整.  相似文献   

10.
黄再祥  周忠眉  何田中 《计算机科学》2014,41(2):111-113,122
许多研究表明关联分类具有较高的分类准确率,然而,大多数关联分类基于"支持度-置信度"框架,在不平衡数据集中,置信度和支持度都偏向产生多数类的规则,因此,少数类的实例容易被错误分类。针对上述问题,提出了一种基于相关规则的不平衡数据的关联分类算法。该算法挖掘频繁且互关联的项集,在以该项集为前件的分类规则中选取提升度最大的规则。规则按结合了提升度、置信度和补类支持度(CCS)的规则强度进行排序。实验表明,该算法取得了较高的平均分类准确率且在分类少数类的实例时具有更高的准确率。  相似文献   

11.
基于决策树规则的分类算法研究   总被引:1,自引:0,他引:1  
在商业利益的驱动下,人们不断地深入研究决策树算法.为了提高分类的精度,提出了一种基于决策树规则的分类算法.通过C4.5决策树算法得出决策规则,计算决策规则的长度,准确率与覆盖率,对所得的决策规则依次按照规则长度与准确率的乘积大小、长度的大小、覆盖率的大小对规则集进行排序构造分类器,选择优选权最高的规则进行匹配分类.实验结果表明,与C4.5算法相比,该方法的分类精度有所提高.  相似文献   

12.
研究分析了现有关联规则分类算法,总结了一般关联规则分类存在的不足,提出了一个基于关联规则挖掘技术构造分类器的新方法。该方法解决了传统算法产生规则太多,分类模型难以理解的问题。  相似文献   

13.
层次化粒子群优化算法及其在分类规则提取中的应用   总被引:2,自引:0,他引:2  
介绍层次化粒子群优化算法,采用自下而上的方式在层次结构中移动粒子.将此算法应用到分类问题,用于Iris数据集的分类规则提取,并与标准的粒子群优化(Particle Swarm Optimizer,PSO)算法相比较,结果表明提取规则的精度得到提高.  相似文献   

14.
分析、比较了当前具有代表性的分类关联算法,总结了关联规则分类存在的问题,便于使用者根据需要选择合适的算法,也便于研究者对算法进行研究改进,提出性能更好的分类算法。  相似文献   

15.
数据挖掘技术的研究现状及发展方向   总被引:10,自引:0,他引:10  
数据挖掘技术是当前数据库和人工智能领域研究的热点。文章对国内外数据挖掘技术的总体情况进行了概括性的介绍,其中包括数据挖掘技术的产生背景、应用领域等,并对当前数据挖掘的分类以及数据挖掘技术中常用的一些挖掘算法进行了说明,最后列出了一些数据挖掘在实际领域中的应用,并对数据挖掘技术的前景作出了展望。  相似文献   

16.
在入侵检测系统和状态检测防火墙等应用中,规则冲突检测及冲突解析算法是影响安全性及服务质量的关键。首先对防火墙过滤规则之间的关系进行了建模和分类。然后在过滤规则关系分类的基础上提出了一种冲突检测算法。该算法能够自动检测、发现规则冲突和潜在的问题,并且能够对防火墙过滤规则进行无冲突的插入、删除和修改。实现该算法的工具软件能够显著简化防火墙策略的管理和消除防火墙的规则冲突。  相似文献   

17.
本文采用一种基于蚁群算法的分类规则挖掘算法,其特征实质上是一种序列覆盖算法。在具体的形式化分析和描述中,以学生成绩系统分析为例,给出了蚁群算法中的蚂蚁个体运动规则和基于蚁群算法的分类规则挖掘算法,按顺序让蚁群搜索规则,移去它覆盖的数据,并不断加以重复,直到搜索完所有的类别属性,且使剩余数据在最小范围内,从而得到一组规则。在对其进行规则剪枝后,最后得到一组最优规则。  相似文献   

18.
基于空间优化的决策树算法*   总被引:1,自引:1,他引:0  
通过增加一些规则来最终减少规则转换的冗余问题,并设计一种算法实现这种优化.在优化后的规则库、单维上用决策树方法查找,结果以位向量的方式存放,保持了算法的高速度,同时有效地节省了空间.  相似文献   

19.
基于模糊区域分布的分类规则提取及推理算法   总被引:5,自引:0,他引:5  
基于不同分类的样本在各规则对应模糊区域的隶属度分布,定义了一种规则相对匹配度,比分类匹配度更能体现样本在不同模糊区域的分布对比.设计了模糊区域分布矩阵,由该矩阵可以算得规则相对匹配度和分类匹配度,并提出了基于规则相对匹配度的分类规则提取算法,同分类匹配度算法相比,该算法充分考虑了每条规则之间的隶属度分布对比,同时以各分类样本的相对数量作为加权系数,从而兼顾了学习空间的全局密度优势和局部数量优势.通过解模糊器实现了基于规则的分类推理,其推理过程比以往算法具有更好的解释性和简洁性.最后,由Iris数据和Wine数据的分类实验证明:无论样本数量均衡与否,由规则相对匹配度提取规则都具有更好的分类效果.  相似文献   

20.
李睿  王彤  李明 《微计算机信息》2006,22(24):49-51
视频流的数据量大,又是一种非结构性的数据,因此视频分类一直是视频分析工作中的一个难点。提出了首先进行视频分割,形成了一个视频属性数据库;然后使用粗糙集的属性约简方法对视频属性数据库进行数据挖掘,提取出分类规则集,实现对视频数据库的分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号