首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 106 毫秒
1.
分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法.它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同的子集作为停机条件,实现连续属性样本分类规则挖掘的完全自动化.它考虑到数据挖掘的目标和要求,充分利用属性与类间的依赖性、属性间的互补性,达到样本分割点数少、分类规则简单和属性约减的目的.最后通过实例进行了验证,并与C4.5算法进行了比较.  相似文献   

2.
连续属性信息系统的规则约简根本问题是属性在连续范围取任何实值,使得应用与离散属性的规则约简方法难于使用。因此解决连续属性信息系统的规则约简问题为当前研究领域所关注。该文结合粗集与模糊集理论与方法提出了一种新的数据处理与规则约简方法,并给出了该方法的实验结果。  相似文献   

3.
在实际形式背景中,属性依赖关系的存在是不可避免的。因此,研究把属性依赖规则应用于概念格构建中是有意义的。通过对属性依赖规则表示和约简的定义,描述了一种新的构建概念格的方法,即把形式背景和约简后属性依赖规则作为输入数据,同时考虑其属性蕴含关系,从而在不需要构建整个概念格的情况下,产生基于属性依赖规则的概念格。其目的在于加快概念格的产生,使其在满足属性依赖规则的情况下,构建概念层次,发现潜在的信息。  相似文献   

4.
一种新的基于连续属性离散化的属性约简方法*   总被引:1,自引:0,他引:1  
通过将连续属性离散化和属性约简结合起来,首先对连续型的属性列进行离散化,得到新的决策表;然后再对新的决策表作属性约简,解决了属性约简过程中由于不考虑连续属性而无法求出准确约简属性的问题。最后通过具体案例表明了该方法具有较好的实用性、有效性,可以很好地应用在含有大量连续属性的数据挖掘项目中。  相似文献   

5.
一种新的属性重要性度量及其规则获取   总被引:1,自引:0,他引:1       下载免费PDF全文
在分析规则知识条件和结论所在等价类包含关系基础上,提出了一个新的属性相对重要性的定义,并给出一种以决策类为基础的逐渐增加条件属性直接获取最简分类规则方法,同时用实例进行了验证。  相似文献   

6.
属性约简和属性值约简是基于粗糙集理论获取决策规则的基础,在分析经典约简算法的基础上,根据粗糙集理论中属性的依赖度和重要度等性质,提出一种改进的约简方法,以获取简洁的决策规则。并运用实例对方法的有效性进行分析和验证。  相似文献   

7.
约束概念格是概念格的特化结构,构造时具有较低的时空复杂度,能从中快速提取比较丰富的信息和知识.为了提取分类规则,在充分分析约束概念格结点外延与数据集等价划分之间关系的前提下,引入了分类支持度和记录支持度的概念,提出了一种面向约束概念格的分类规则提取算法(Classification Rule Acquisition Algorithm based on Constrained Concept Lattice,CRACCL),并采用UCI数据集作为实验集,验证了本算法能够提取更加实用和准确的分类规则.  相似文献   

8.
一种基于粗集理论的分类规则挖掘的实现方法   总被引:8,自引:0,他引:8  
研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。基于粗集理论的分类规则挖掘是一种重要的方法,在分析有关算法的基础上提出一种改进方法,并通过实例证明了该方法的效率有所提高。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。  相似文献   

9.
针对基于决策形式背景进行属性约简与规则提取能够更便捷有效地获取知识,因此规则提取及属性约简是形式概念分析理论重要的研究课题。本文基于等价关系研究粒协调决策形式背景的属性约简与规则提取,定义粒协调集与粒约简,给出粒协调集判定定理,并结合布尔方法给出属性约简算法,最后利用集值向量包含度这一工具给出决策形式背景中的乐观规则融合方法与悲观规则融合方法。  相似文献   

10.
确立了结合粗糙集理论和神经规则法进行数据挖掘的方法.首先通过粗糙集对需要挖掘的数据进行预处理,实现属性的约简,然后应用神经规则法进行网络剪枝和规则提取.通过实例计算表明,在结果置信度降低不多的情况下,可以得到简单明确的关联规则,并有效地提高数据挖掘的效率.  相似文献   

11.
一种基于GEP的分类规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于一种新的自动程序设计方法基因表达式程序设计(GEP),通过设计适应函数、初始化群体的优化、增加新的遗传算子以及采用演化策略中的(λ+μ)淘汰策略等对原始GEP算法进行有效的改进,设计出一种新的数据挖掘算法。采用UCI机器学习知识库中的数据集对该算法进行了实验,并通过与C4.5及文献[3]的比较,检验了该算法的准确性。  相似文献   

12.
一种实现分类问题中连续值属性离散化的方法   总被引:1,自引:0,他引:1  
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。  相似文献   

13.
一种挖掘数值属性的二维优化关联规则方法   总被引:1,自引:0,他引:1  
贺志  田盛丰  黄厚宽 《软件学报》2007,18(10):2528-2537
优化关联规则允许在规则中包含未初始化的属性.优化过程就是确定对这些属性进行初始化,使得某些度量最大化.最大化兴趣度因子用来发现更加有趣的规则;另一方面,允许优化规则在前提和结果中各包含一个未初始化的数值属性.对那些处理一个数值属性的算法进行直接的扩展,可以得到一个发现这种优化规则的简单算法.然而这种方法的性能很差,因此,为了改善性能,提出一种启发式方法,它发现的是近似最优的规则.在人造数据集上的实验结果表明,当优化规则包含两个数值属性时,优化兴趣度因子得到的规则比优化可信度得到的规则更有趣.在真实数据集上的实验结果表明,该算法具有近似线性的可扩展性和较好的精度.  相似文献   

14.
一种基于决策表的分类规则挖掘新算法   总被引:2,自引:0,他引:2  
The mining of classification rules is an important field in Data Mining. Decision table of rough sets theory is an efficient tool for mining classification rules. The elementary concepts corresponding to decision table of Rough Sets Theory are introduced in this paper. A new algorithm for mining classification rules based on Decision Table is presented, along with a discernable function in reduction of attribute values, and a new principle for accuracy of rules. An example of its application to the car‘s classification problem is included, and the accuracy of rules discovered is analyzed. The potential fields for its application in data mining are also discussed.  相似文献   

15.
Fingerprint classification is a challenging pattern recognition problem which plays a fundamental role in most of the large fingerprint-based identification systems. Due to the intrinsic class ambiguity and the difficulty of processing very low quality images (which constitute a significant proportion), automatic fingerprint classification performance is currently below operating requirements, and most of the classification work is still carried out manually or semi-automatically. This paper explores the advantages of combining the MASKS and MKL-based classifiers, which we have specifically designed for the fingerprint classification task. In particular, a combination at the ‘abstract level’ is proposed for exclusive classification, whereas a fusion at the ‘measurement level’ is introduced for continuous classification. The advantages of coupling these distinct techniques are well evident; in particular, in the case of exclusive classification, the FBI challenge, requiring a classification error ≤ 1% at 20% rejection, was met on NIST-DB14. Received: 06 November 2000, Received in revised form: 25 October 2001, Accepted: 03 January 2002  相似文献   

16.
马慧  汤庸  潘炎 《计算机工程》2006,32(17):132-134
随着各种形式的数据的迅速增长,业务数据中的时态信息挖掘问题受到人们普遍关注。该文提出了一种带有效时间区间的时态关联规则,给出了一种基于FP-树的挖掘方法。该方法利用分区挖掘的思想,以分区为单位表示项集的有效时间区间,并为每个分区构建FP-树,大大简化了对某个项集在其有效时间区间中的出现次数的计算,从而更有效地计算时态置信度。最后用一个例子对该方法的执行过程进行了阐述。  相似文献   

17.
提出了一种支持规则动态检测机制的工作流系统,实现了规则的实时发现和实时运行功能,在一定程度上解决了业务领域中不同版本规则之间进行切换运行的问题。  相似文献   

18.
对运输能力受限条件下的跨单元调度问题进行分析, 提出一种基于动态决策块和蚁群优化 (Ant colony optimization, ACO) 的超启发式方法, 同时解决跨单元生产调度和运输调度问题. 在传统超启发式方法的基础上, 采用动态决策块策略, 通过蚁群算法合理划分决策块, 并为决策块选择合适的规则. 实验表明, 采用动态决策块策略的超启发式方法比传统的超启发式方法具有更好的性能, 本文所提的方法在最小化加权延迟总和目标方面有较好的优化能力 并且具有较高的计算效率.  相似文献   

19.
In this paper we propose a new image classification technique. According to this note that most research focuses on extraction of features in the frequencydomain, location, and reduction of feature dimensions, in this research we focused on learning step in image classification. The main aim is to use theheuristic methods to increase the function of the estimator of the learning algorithm and continue to achieve the desired state, as well as categorizationwithout user interference and automatically performed by the model produced from the above steps. So, in this paper, a new learning approach based onthe Salp Swarm Algorithm was proposed that was implemented and evaluated on learning algorithm Decision Tree, K-Nearest Neighbors and Naïve Bayes.The results demonstrate the improvement of the performance of learning algorithms in all the achieved criteria by using the SSA algorithm in comparisonwith traditional learning algorithms. In the accuracy, sensitivity, classification error and F1 criterion, the best performance of the proposed model is usingthe Decision Tree learning method with values of 99.17%, 100%, 0.83% and 95.65% respectively. In the specificity and precision criterion, the bestperformance of the proposed model is based on K-Nearest Neighbors learning method with values of 100%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号