首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 614 毫秒
1.
一种新的基于粗糙集理论的决策表离散化算法   总被引:12,自引:0,他引:12  
主要研究了粗糙集理论在决策表离散化中的应用,提出了一种新的基于粗糙集理论的决策表离散化算法.该算法是一种基于决策表属性重要性的算法,首先使用条件属性与决策属性的互信息来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化.  相似文献   

2.
为解决基于卡方统计量离散化方法在处理未知数据特性时的参数难确定问题,提出了一种基于粗糙集方法的自动离散化方法.该方法根据粗糙集理论对知识不确定性和属性重要性的分析,利用粗糙集方法处理数据不需要先验知识的特点,以基于最小描述长度原理的决策系统信息熵作为离散化过程的评价函数,并由属性断点平均重要性确定多连续属性的离散化顺序,构建了自动的离散化方法RSE Chi2.实例测试表明,该方法性能良好,能根据样本数据本身的特性,自动协调拟合和预报精度,不需要先验设定显著性水平和不一致率等参数,离散化结果更为精简,所建决策树分类模型具有较好的预报性能.  相似文献   

3.
属性离散化能够降低问题的复杂度,得到更加简短、精确且易于理解的规则。针对现有离散化方法在选择断点时没有考虑属性间和属性内断点的互斥性且不能保证保持决策表的不可分辨关系,本研究提出一种新的基于信息熵的粗糙集连续属性多变量离散化算法(PAD)。它以信息熵作为选择断点的衡量标准,以不可分辨关系为停止标准并引入5条断点预选确选策略。实验结果表明,引入断点预选、确选策略的PAD算法与Ros-tta软件中的5个离散化算法相比,具有较高的预测精度和较少的断点数目。  相似文献   

4.
粗糙集理论适于处理离散属性,对于连续属性,需经离散化,其本质是搜索最小断点集以及最小属性约简,两者均为NP难问题,为此提出了样本可分辨矩阵和覆盖策略,并引入权重,将其归结为约束最小化问题,采用蚁群算法求解.引入了启发式信息的动态计算方法,并结合后验的信息素,计算选择概率,逐步引导蚁群可行解构造,2类信息的结合有助于提高寻优性能.将该方法用于2类同系化合物的毒性作用机制分类研究,可有效地实现断点集最小化和属性最小约简,由此便于建立分类规则库.相比判别分析、径向基网络和支持向量机3种方法,该规则库具有更加良好的预测性能,且易于专业分析和理解.  相似文献   

5.
多维属性离散化能提升机器学习算法训练的速度与精度,目前的离散化算法性能较低且多是单属性离散,忽略了属性之间的潜在关联。基于此,提出了一种基于森林优化的粗糙集离散化算法(a discretization algorithm based on forest optimization and rough set,FORDA)。该算法针对多维连续属性的离散化,依据变精度粗糙集理论,设计适宜值函数,进而构建森林寻优网络,迭代搜索最优断点子集。在UCI数据集上的实验结果表明,与当前主流的离散化算法相比,所提算法能避免局部最优,显著提升了SVM分类器的分类精度,其离散化性能更为优良,且具有一定的通用性,验证了算法的有效性。  相似文献   

6.
提出了数据处理的支持向量机-粗集(SVM-RS)模型.根据原始突水样本构造SVM预测模型,对该模型依次约简部分属性做重复测试,当预测精度降低,表示该属性重要,予以保留,否则,予以约简,以此优化突水预测的属性集;利用SVM对连续的属性值进行离散化处理,以线性SVM的分类超平面确定属性值的断点位置;利用RS分析突水决策表,提取预测规则.该模型综合了SVM泛化性能优与RS分析数据、提取规则能力强的优势,在实际应用中表现良好.  相似文献   

7.
实际问题中经常涉及连续的数值属性,然而许多归纳学习算法却是针对离散属性空间的.因此,对数据进行预处理的离散化算法一直受到人们的重视.兼顾所有属性间关系的整体离散化是一个重要方法,该文提出基于数据分区的整体离散化算法,它首先对例子集合在各个连续属性上的取值进行统一的放大处理,选出包含最多聚类信息的属性,将整个例子集合粗略的划分为多个分区;然后在各个分区中分别进行聚类、合并.该方法改进了基本的整体离散化算法,并利用农业专家系统中的土壤分类数据对算法进行了验证.  相似文献   

8.
为了提高复杂系统故障识别的精度和降低误报率,利用粗糙集理论、遗传算法、神经网络等计算智能方法的优势,提出一种基于计算智能技术融合的故障识别方法.针对原始样本数据的不确定性和不完备性,利用粗糙集对原始样本数据进行数据归一化、离散化、属性约简等预处理,求得能够覆盖原始数据特征的具有最大完备度的最小规则集.利用具有全局搜索能力的遗传算法直接训练反向传播神经网络的权值,将规则集作为网络输入,形成优化网络模型.采用该模型对预处理的各种状态故障特征向量进行分类决策,实现故障识别.通过电机轴承故障识别实验表明,该方法能够优化网络结构,提高故障识别速度和准确率.  相似文献   

9.
针对基于信息熵的决策树算法中存在多值属性偏向、连续属性处理不佳和时间复杂度较高等问题,提出一种基于离散比概念的决策树特征度量方法.首先采用K-means聚类算法对连续性数值属性进行离散化处理,其次利用属性在各个分类中的权重以及在整个条件属性中的权重比值,计算出该属性的离散比,避免了计算熵过程中复杂的对数运算,最后根据离...  相似文献   

10.
对目前粗糙集的离散化算法进行了分类讨论,重点分析了基于信息熵的离散化算法的理论基础以及实现步骤,并就该算法对于同一属性在不同样本数据集上的应用情况进行了分析.实验表明,该算法对于部分属性具有数据敏感性,当选择这些属性作为依据时会影响系统的决策能力.  相似文献   

11.
提出了一种基于Rough集和RBF神经网络结合的车牌字符识别方法。该方法针对车牌字符二值化图像,给出了基于粗糙集理论的知识获取方法,包括根据训练样本的特征向量建立决策表、离散决策表属性、约简决策表属性,然后由约简后的属性构造RBF网络识别器。试验表明该方法有效地减少了决策属性的个数,简化了神经网络识别器的结构,提高了泛化能力和抗噪声能力,在车牌字符识别中取得了较好的识别效果。  相似文献   

12.
粗糙集理论中一种属性离散化算法   总被引:6,自引:0,他引:6  
针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简。该算法易于理解,计算简单,以实例说明了算法的合理性和有效性。  相似文献   

13.
作为数据挖掘的重要工具,粗糙集理论被广泛的应用于关系数据库中属性相关性描述、属性集约简、属性重要性度量、规则发现等方面。该文在分析基于信息系统的粗糙集理论的基础上,对基于分辨矩阵的属性约简算法进行了详尽的描述。针对该算法存在的时间和空间性能不理想问题,提出度量单个条件属性对系统概念贡献程度的关联度的概念,以此作为启发式信息对原算法进行改进,得到条件属性的约简。理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率,为粗糙集理论更广泛地应用于具体的实践提供了一种方法。  相似文献   

14.
This paper presents a hybrid soft computing modeling approach for a neurofuzzy system based on rough set theory and the genetic algorithms ( NFRSGA ). The fundamental problem of a neurofuzzy system is that when the input dimension increases, the fuzzy rule base increases exponentially. This leads to a huge infrastructure network which results in slow convergence. To solve this problem, rough set theory is used to obtain the reductive rules, which are used as fuzzy rules of the fuzzy system. The number of rules decrease, and each rule does not need all the conditional attribute values. This results in a reduced, or not fully connected, neural network. The structure of the neural network is relatively small and thus the weights to be trained decrease. The genetic algorithm is used to search the optimal discretization of the continuous attributes. The NFRSGA approach has been applied in the practical application of building a soft sensor model for estimating the freezing point of the light diesel fuel in a Fluid Catalytic Cracking Unit (FCCU) , and satisfying results are obtained.  相似文献   

15.
1 Introduction Intelligent information processing is a research hotspot in information science. However, knowledge acquisition is a bottleneck in intelligent systems. Pro- posed by Pawlak in 1982[1], the rough set theory (RS theory) is based on a classification mechanism and regards knowledge as partition over data using equi- valence relationships in a given domain. The RS is a tool to deal with expressing, studying and reasoning of incomplete data and imprecise knowledge, which has been wi…  相似文献   

16.
基于邻域关系的决策表约简   总被引:1,自引:0,他引:1  
针对经典粗糙集理论难以处理连续型数据的特点,提出基于邻域关系的决策表约简方法。该方法在连续型数据的决策表中引入邻域关系,通过邻域关系进行信息粒化,避免离散化过程带来的信息损失。通过定义邻域正域和邻域约简概念,分析邻域正域的单调性原理,提出基于邻域关系的属性重要度概念,进一步设计了两种启发式约简算法。理论分析与实例表明该方法是有效可行的。  相似文献   

17.
基于粗糙集和神经网络的机械故障诊断研究   总被引:1,自引:0,他引:1  
提出了粗糙集理论与神经网络结合的机械故障诊断方法,研究了连续属性离散化的SOM方法和条件属性约简的差别矩阵方法,归纳了构建神经网络需考虑的关键问题,用一个算例验证了方法的有效性.结果表明:粗糙集能有效地约简冗余信息,简化神经网络的结构,缩短网络的训练时间,提高诊断的效率;SOM网络能将连续性输入映射成具有理想聚类结果的离散性输出,并能保持数据间的拓扑结构不变;利用差别矩阵对决策表进行约简,结果准确可靠;BP神经网络泛函逼近能力强,能快速准确地完成特征空间到故障空间的映射.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号