首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 236 毫秒
1.
通过分析分类规则与训练集之间的映射关系,采用集合的相关运算寻找特征规则及相应特征集.从而消除分类规则集中存在的冗余,并在此基础上提出了基于集合运算的分类规则处理算法(PASO)。最后,以恒星光谱数据为背帚,实验验证了该方法的正确性和可行性。  相似文献   

2.
使用SWRL(Semantic Web Rule Language)描述的数据蕴含了更多的语义信息,SWRL数据集上的数据挖掘过程必须充分考虑数据的语义特征。已有的关于这种类型数据的候选频繁模式生成方法可能产生大量无意义的模式,加重了模式评价过程的计算负担。针对这一缺陷提出了基于向下求精规则和相容谓词的候选频繁模式生成方法,同时定义了谓词数量约束,从而避免产生过多的非频繁模式和冗余模式。实验证明该方法可提高频繁模式生成的效率。  相似文献   

3.
软集是一种新的处理不确定性问题的数学工具。基于软集和逻辑公式,提出一种新的关联规则挖掘方法。将软真度引入软集数据关联规则挖掘,利用软真度描述属性集之间的量化关系;讨论软真度和支持度之间的联系,给出满足给定的支持度阈值和可信度阈值的软关联规则挖掘方法。实例分析结果表明,该方法可约简冗余,提高效率。  相似文献   

4.
粗糙集与决策树结合诊断故障的数据挖掘方法   总被引:5,自引:1,他引:5  
根据数据挖掘技术用于故障诊断的基本思想,利用粗糙集进行数据归纳,过滤大量故障数据中的冗余属性,得到精简故障数据集。而后,用决策树分类方法处理精简数据集,产生分类所需的规则以进行分类,并结合实例说明了该方法的工作步骤。由实例可知该方法用于故障诊断的可行性,最后指出实际应用过程中的一些技术难题。  相似文献   

5.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

6.
针对利用触发图和活化图的方法来判定主动规则集的可终止性存在一定的局限性,从而影响了运行阶段规则系统的执行效率并限制了主动规则在众多领域中的灵活应用的问题.提出了利用基于活化路径建立的条件公式进行判定的方法,结果表明该方法可以比现有方法发现更多的可终止性情形.对主动规则集的设计和应用具有一定的意义.  相似文献   

7.
一个基于粗糙集和决策树的最简分类规则集生成算法   总被引:5,自引:0,他引:5  
利用粗糙集理论中属性核与不可分辨关系给出了属性约简和数据过滤算法,去除信息系统中与决策无关的冗余信号,在简化的信息系统基础上用传统算法构造决策树,总利用由粗糙度理论推出的极小、极大化学习方法对决策树规则进行极小、极大化处理,最后给出了一个最简分类规则集生成算法。  相似文献   

8.
基于FP-Growth算法在不产生侯选项集的情况下产生所有的频繁项集的思想上提出一种多维关联规则挖掘方法。该方法以数据立方体下的多维数据为研究对象,通过挖掘频繁谓词集发现多维关联规则,并通过理论和实例验证的方法证明了该方法的可行性。  相似文献   

9.
随着防火墙规则数目的增多,Diverse Firewall Design设计方法越来越受到重视.在应用该方法进行规则集设计时,多个开发团队会独立地编写若干规则集.由于规则集配置的复杂性,这些规则集有可能不一致.因此,需要使用规则集比较算法,判断这些规则集是否等价,以达到检测出错误配置的目的.然而现有规则集比较算法,实现复杂且效率较低.针对这一问题,提出了一种基于规则交集运算的规则集比较算法.该算法首先使用规则冲突消除算法对规则集进行预处理,将规则集比较问题,转换成多维空间中的图形比较问题;然后利用规则交集运算,判断图形所占区域和颜色是否一致,进而确定规则集是否等价.理论分析和测试表明,算法能检测出规则集之间的不同点,且时空效率优于现有算法.  相似文献   

10.
基于互信息规则剪枝的关联文本分类   总被引:1,自引:0,他引:1  
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器,对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.  相似文献   

11.
基于传统遗传算法的分类规则挖掘方法,通常存在挖掘出的规则质量不高,优化后种群中的冗余规则太多,分类准确率较低等问题.文中分析了分类规则挖掘原理,提出基于混合遗传算法的分类规则挖掘方法能够有效地克服上述缺点,从而提高分类规则挖掘的准确性.  相似文献   

12.
关联规则是数据挖掘的重要研究内容之一,而传统算法生成的关联规则之间存在着大量的冗余规则,这使得用户分析和利用这些规则变得十分困难。为了帮助用户分析,可以采用各种技术来有效地减少大量冗余的规则。本文介绍了冗余关联规则的概念,冗余关联规则删减的算法,结合当前的研究成果分析冗余关联规则的发展趋势。  相似文献   

13.
提出了一种基于rough set和neural network的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。  相似文献   

14.
遗传算法编码设计及其在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘就是从大量的数据中提取或者“挖掘”知识,从而实现对数据资源的有效利用.关联分析是数据挖掘诸多功能中应用最广泛的一种.关联分析用于发现关联规则,关联规则描述了给定数据集的项之间的有趣联系.提出了一种基于遗传算法的关联规则的挖掘算法.在关联规则的编码方面,提出了对个体进行变长编码的方法,从而在一定程度上减少了无效规则的数目;在适应度函数的构造方面也进行了一些改进;针对规则库的覆盖问题,采用标志位的方法,对挖掘过的规则设置标志,避免规则重复挖掘.  相似文献   

15.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

16.
粗糙集在数据挖掘分类规则中的应用研究   总被引:5,自引:0,他引:5  
数据集中的冗余性会降低数据挖掘结果的解释能力和精度,介绍了数据集中挖掘分类规则的基本原则,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不同相容规则的决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则。  相似文献   

17.
分类特征规则的数据挖掘技术   总被引:4,自引:0,他引:4  
在浩翰的数据资源中发现并提取有价值的知识,是目前数据库研究的热点问题,为此,运用集合理论对关系数据库进行数据分类,抽取它们的共同特征,讨论了分类特征规则的基本模型,给出了发现算法;通过实例分析表明:该算法能够快速发现分类特征规则,具有现实意义.  相似文献   

18.
由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号