首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
传统的关联规则文本分类一般以规则的置信度作为分类准则,完全忽略了特征词的词频对分类的影响.这就导致了关联文本分类算法的性能较差,针对这个问题,在ARC-BC算法的基础上,提出了基于词频向量的关联规则文本分类算法TFARC(term frequency-based ARC),该算法引入了词频向量,重新定义了规则和文本的可信度作为分类器的分类准则,用迭代的方法求出每条规则的最佳调整因子.实验结果表明,词频的引入确实提高了关联规则文本分类的准确率.  相似文献   

2.
梁小寒  陈慧萍 《计算机工程与设计》2011,32(4):1319-1321,1325
为得到更高的分类精度和效率,提出了基于一个新的类的关联分类算法CACA(a new class based associative classifica-tion approach)。该方法使用基于策略的类来削减频繁模式的搜索空间;设计一个OR-Tree(ordered rule-tree)的有序规则树来存储规则和他们的信息并且重新定义一个紧凑集,以便构造的分类器也是紧凑唯一的;同步规则的生成和分类器的构造以缩小规则的挖掘空间以便加快规则的生成。实验结果表明,CACA算法在关联分类方法中具有更高的准确度和效率。  相似文献   

3.
研究分析了现有关联规则分类算法,总结了一般关联规则分类存在的不足,提出了一个基于关联规则挖掘技术构造分类器的新方法。该方法解决了传统算法产生规则太多,分类模型难以理解的问题。  相似文献   

4.
针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分类修剪的关联分类算法改进方案ACCP.根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪进行了改进,有效提高了分类准确率和算法运行效率.实验结果表明,此算法改进方案相比传统CBA算法和C4.5决策树算法有着更高的分类准确率,取得了较好的应用效果.  相似文献   

5.
针对现有关联分类技术的不足,提出了一种适用于关联分类的增量更新算法IUAC。该算法是基于频繁模式树挖掘和更新关联规则的,并使用一种树形结构来存储最终用于分类的关联规则。同时,增加了对分类规则的约束条件,进一步控制了用于分类的关联规则的数量。最后,对算法整体进行了分析和讨论。  相似文献   

6.
CBC-DS:基于频繁闭模式的数据流分类算法   总被引:2,自引:0,他引:2  
基于关联规则的分类算法通常根据频繁模式生成类关联规则,但频繁模式挖掘易遭受组合爆炸问题,影响算法效率.并且数据流的出现也对分类算法提出了新的挑战.相对于频繁模式,频繁闭模式的数目较少,挖掘频繁闭模式的算法通常具有较高的效率.为此,提出了一种高效的基于频繁闭模式的数据流分类算法-CBC-DS.主要贡献在于:1)提出了一种基于逆文法顺序FP-Tree的频繁闭项集单遍挖掘过程,用于挖掘类关联规则,该过程采用了一种混合项顺序搜索策略以满足数据流挖掘的单遍性需求,并采用位图技术提高效率;2)提出了"自支持度"概念,用于筛选规则以提高算法分类精度.实验表明,位图技术能够提高算法速度2倍以上,利用自支持度能够提高算法平均精度0.5%左右;最终CBC-DS算法的平均分类精度比经典算法CMAR高1%左右,并且CBC-DS算法的规则挖掘速度远快于CMAR算法.  相似文献   

7.
研究了现有的关联分类算法在文本分类中的应用,发现对于有结构的文本数据,关联分类算法未考虑文本的语义信息导致分类精度不够理想,为此提出了基于规则重构的关联文本分类方法.该方法利用词共现模型,在已挖掘的分类规则基础上,将具有高共现程度的词对组合在一起进行规则重构,形成了有结构的带有文本语义信息的分类规则,再利用它们对新文本进行分类.实验结果表明,该方法在分类精度上优于其它的关联文本分类方法(ARC).  相似文献   

8.
陈晓辉 《福建电脑》2008,24(7):111-113
基于频繁模式的文本关联分类方法与基于跳跃显露模式的文本分类方法各具优点与不足。本文集成这两种方法.提出基于频繁跳跃模式和非频繁跳跃模式的分类方法。实验结果表明,该方法的分类精度高于关联分类方法而召回率和分类速度优于基于跳跃显露模式的分类方法。有效弥补了两种分类方法的不足。  相似文献   

9.
基于自适应加权的文本关联分类   总被引:1,自引:0,他引:1  
在文本关联分类研究中,训练样本特征词的分布情况对分类结果影响很大.即使是同一种关联分类算法,在不同的样本集上使用,分类效果也可能明显不同.为此,本文利用加权方法改善文本关联分类器的稳定性,设计实现了基于规则加权的关联分类算法(WARC)和基于样本加权的关联分类算法(SWARC).WARC算法通过规则自适应加权调整强弱不均的分类规则;SWARC算法则自适应地调整训练样本的权重,从根本上改善不同类别样本特征词分布不均的情况.实验结果表明,无论是WARC还是SWARC算法,经过权重调整后的文本分类质量明显提高,特别是SWARC算法分类质量的提高极为显著.  相似文献   

10.
针对医学图像数据的特殊性,提出了一种适合挖掘大量医学图像数据的关联分类算法.该算法以频繁模式树为基础,通过引入双支持度,排除一部分对分类无意义且存在干扰的项,以提高分类正确率.实验结果表明,当用于医学图像分类时,该算法可以取得同样的基于关联规则的分类算法CMAR更高的执行效率及更好的分类效果.  相似文献   

11.
张桂刚 《计算机应用》2011,31(3):670-673
基于各种海量规则信息处理的需求,提出了海量规则网的维护与优化的基本方法。给出了海量规则网增量集成维护与删除维护的基本算法步骤,利用替代规则模块的方法进行规则网优化。最后用实例对规则网优化进行了具体说明。海量规则网维护与优化部分拓展了现有规则网处理模式,提出了新的处理方法。  相似文献   

12.
基于SOA的业务规则代理研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对业务规则领域存在的问题,分析规则引擎主要的实现技术与规范以及基于SOA规则引擎的优越性,提出基于SOA的规则引擎代理。该结构能屏蔽不同业务规则引擎之间的异构性,向客户端提供统一的Web服务接口来执行不同规则引擎的规则。给出应用于移动公司的具体实例。  相似文献   

13.
二维优化排样方法及实现技术   总被引:1,自引:0,他引:1  
在工业应用领域中存在大量的二维下料问题,其中应用最多的是矩形件下料问题.矩形件下料问题的关键是寻找二维平面的优化布局.针对工业生产中实际存在的问题与约束条件,给出了新的规则设计理论和数据模型,利用覆盖率和有效覆盖率的概念来控制余料合并操作的执行,运用布局规则、组合规则和切割规则给出了一种新的启发式算法.实验分析和工业应用证明,该启发式算法可以有效地提高板材的整体利用率,极大地减少了板材损耗.  相似文献   

14.
提出了一种新的用于关系数据库查询缓冲和预取的方法.首先将数据查询语句抽象成由四元组组成的查询模板,同时保存了查询语句的实际参数.基于这些模板和参数,提出了两种智能预取算法以适应两类不同的数据查询需求.第一个算法基于蚁群规则,该算法能够用于预测将来具有最高可能性的查询.经过监控某个特定应用对于数据库所发生的大量查询,实际的模板数要远远小于发生的查询数.当通过考虑查询模板和跟踪历史查询记录来预测未来可能发生的查询时,提出了第二类算法.该算法基于惯性规则,它使用BP网络来跟踪用户的查询历史.相对于前面的算法,该算法更适合多应用共存的场合.在模拟实验中发现对于单个应用而言,查询具有很高的模板依赖性,而对于多应用场合,惯性规则具有更好的适应性.  相似文献   

15.
傅鹤岗  张李 《计算机工程》2011,37(20):103-104
提出一种基于默认规则的防火墙优化方法,根据规则的匹配概率及防火墙日志,从默认规则中分离出简单规则,分析这些规则与原规则的关系,并合并成新的规则。评价规则对防火墙性能的影响,并选择性地加入防火墙规则库,实现防火墙线性匹配优化。实验结果表明,该方法在一般情况下能有效降低规则的平均匹配次数,提高防火墙性能。  相似文献   

16.
网络告警关联中隐含着丰富的模式知识,通过研究告警信息间的因果相关性,能够显著的提高网络故障管理的智能度.文章通过研究网络告警中的知识发现问题,提出一种基于关联规则和情景规则的网络告警分析模型.  相似文献   

17.
时域数据的挖掘是数据挖掘领域经常遇到的问题。而时域关联规则的发现研究是关联规则的一个重要研究课题。该文在对周期关联规则进行深入研究的基础上,形式化定义了基本的时域关联规则概念,并提出了基于Apriori的发现周期关联规则的CCAR算法。CCAR的核心思想是首先把各项目按照周期时间分布进行聚类,根据聚类结果把每个项目分成几个动态的有效时间区域。在应用Apriori算法时,用项目的各个时间区域扩展项目集Ⅰ,然后根据作者提出的带时间属性的JOIN操作由Lk-1生成Ck,并由约简操作删除Ck中不满足条件的候选频繁项目集以提高算法的效率。算法理论分析和实验都表明CCAR是有效的。  相似文献   

18.
郑宏珍  刘扬  战德臣 《计算机科学》2006,33(11):180-181
提出一个求缺省规则的框架,通过合并条件属性所决定的类,生成组合类,可以构造覆盖更多对象的规则,生成从这些组合类映射到占优决策的规则。结果规则比确定规则至少具有两个重要的优点:(1)结构上简单;(2)即使规则相对训练集可能不完全,但是当处理未见的新事例时将表现得更好。系统对未来对象的分类质量,将在很大程度上依据系统一般化知识的能力。  相似文献   

19.
粗糙集分类算法中的近似决策规则和规则匹配方法   总被引:1,自引:0,他引:1  
粗糙集分类算法在应用标准决策规则进行新对象分类时,经常碰到决策规则与新对象不完全匹配的情况。因此,近似决策规则和部分匹配方法常用于提高决策规则与新对象匹配的可能性。本文在概述和比较两种近似决策规则生成算法的基础上,以一个文本分类系统为例,提出了一种综合的、更有效的近似决策规则生成算法。文章还介绍了几种通用的规则匹配方法,提出了一系列实用的完全匹配和部分匹配公式。实验表明,新提出的近似决策规则生成算法和规则匹配公式能够有效地提高决策规则与新对象的匹配可能性与准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号