首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 750 毫秒
1.
实际问题中经常涉及连续的数值属性,然而许多归纳学习算法却是针对离散属性空间的.因此,对数据进行预处理的离散化算法一直受到人们的重视.兼顾所有属性间关系的整体离散化是一个重要方法,该文提出基于数据分区的整体离散化算法,它首先对例子集合在各个连续属性上的取值进行统一的放大处理,选出包含最多聚类信息的属性,将整个例子集合粗略的划分为多个分区;然后在各个分区中分别进行聚类、合并.该方法改进了基本的整体离散化算法,并利用农业专家系统中的土壤分类数据对算法进行了验证.  相似文献   

2.
以面向对象的软件度量为研究对象,首先采用SOM神经网络离散化度量元因子矩阵数据,接着对于得到的离散化的矩阵数据采用粗糙集理论的属性约简算法进行属性约简,然后根据约简得到规则构造模糊神经网络的网络结构,并采用BP算法对网络进行训练,最后通过仿真实验验证了该算法。  相似文献   

3.
提出了一种新的连续信息系统的知识获取方法.首先给出了连续属性离散化方法,该方法可以使得离散化后得到的分类的类数适度,丢失的信息量尽量减少;然后在此基础上给出了连续信息系统属性约简的一种简易算法;最后实例证明了该离散化方法是可行和有效的.  相似文献   

4.
一种新的基于粗糙集理论的决策表离散化算法   总被引:12,自引:0,他引:12  
主要研究了粗糙集理论在决策表离散化中的应用,提出了一种新的基于粗糙集理论的决策表离散化算法.该算法是一种基于决策表属性重要性的算法,首先使用条件属性与决策属性的互信息来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化.  相似文献   

5.
针对基于信息熵的决策树算法中存在多值属性偏向、连续属性处理不佳和时间复杂度较高等问题,提出一种基于离散比概念的决策树特征度量方法.首先采用K-means聚类算法对连续性数值属性进行离散化处理,其次利用属性在各个分类中的权重以及在整个条件属性中的权重比值,计算出该属性的离散比,避免了计算熵过程中复杂的对数运算,最后根据离散比的大小确定各个特征属性之间的拓扑结构,完成树的构建.结果表明,相较于K_C4.5和Id3_improved两种改进的决策树算法,基于离散比属性分割的算法能更有效地解决多值属性偏向,降低算法的时间复杂度,并且在实际产生的连续性数据集的分类应用上有进一步的突破.  相似文献   

6.
多维属性离散化能提升机器学习算法训练的速度与精度,目前的离散化算法性能较低且多是单属性离散,忽略了属性之间的潜在关联。基于此,提出了一种基于森林优化的粗糙集离散化算法(a discretization algorithm based on forest optimization and rough set,FORDA)。该算法针对多维连续属性的离散化,依据变精度粗糙集理论,设计适宜值函数,进而构建森林寻优网络,迭代搜索最优断点子集。在UCI数据集上的实验结果表明,与当前主流的离散化算法相比,所提算法能避免局部最优,显著提升了SVM分类器的分类精度,其离散化性能更为优良,且具有一定的通用性,验证了算法的有效性。  相似文献   

7.
粗糙集理论中一种属性离散化算法   总被引:6,自引:0,他引:6  
针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简。该算法易于理解,计算简单,以实例说明了算法的合理性和有效性。  相似文献   

8.
研究了连续属性空间离散化问题,将信息熵函数与无穷范数的要领应用到连续属性离散化问题,提出了基于信息商熵的属性空间极小化算法,在此基础上,提出了连续属性空间上的规则学习算法,并给出了数值实验结果。  相似文献   

9.
将粗糙集理论与神经网络相结合,构建了基于粗糙集-径向基(RBF)神经网络集成的产业集群生命周期识别模型.该模型运用基于MDV(maximum discernibility value)函数与信息熵的模糊聚类算法进行连续属性离散化处理,采用粗糙集理论约简出重要指标体系,将训练样本输入RBF神经网络进行学习和训练,进而对检验样本的生命周期阶段进行判断.对我国138组产业集群样本数据的分析结果表明:基于MDV函数与信息熵的模糊聚类算法能够有效改善离散化效果,且该模型对检验样本的总体预测精度达到82.61%,从而证实了该识别模型的有效性和实用性.  相似文献   

10.
粗糙集理论适于处理离散属性,对于连续属性,需经离散化,其本质是搜索最小断点集以及最小属性约简,两者均为NP难问题,为此提出了样本可分辨矩阵和覆盖策略,并引入权重,将其归结为约束最小化问题,采用蚁群算法求解.引入了启发式信息的动态计算方法,并结合后验的信息素,计算选择概率,逐步引导蚁群可行解构造,2类信息的结合有助于提高寻优性能.将该方法用于2类同系化合物的毒性作用机制分类研究,可有效地实现断点集最小化和属性最小约简,由此便于建立分类规则库.相比判别分析、径向基网络和支持向量机3种方法,该规则库具有更加良好的预测性能,且易于专业分析和理解.  相似文献   

11.
粗糙集理论中基于属性重要性的离散化方法   总被引:4,自引:0,他引:4  
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。目前已有许多离散化方法,存在的主要问题是断点集的选取带有很大的主观性,导致大多数的离散化算法难以得到较满意的离散效果。分析了当前研究中常用的离散化方法,提出了一种基于属性重要性的离散化方法,利用遗传算法,把最小断点集作为优化目标,利用遗传算法,以属性重要性构造适应度函数,保证了原决策系统的不可分辨关系,避免了决策表信息的损失,所得结果相对来说比较客观。  相似文献   

12.
1 Introduction Intelligent information processing is a research hotspot in information science. However, knowledge acquisition is a bottleneck in intelligent systems. Pro- posed by Pawlak in 1982[1], the rough set theory (RS theory) is based on a classification mechanism and regards knowledge as partition over data using equi- valence relationships in a given domain. The RS is a tool to deal with expressing, studying and reasoning of incomplete data and imprecise knowledge, which has been wi…  相似文献   

13.
排水管路运行风险的实时评估对于提高管路风险预测十分有必要。介绍了Semi-Naive—Sealer属性离散化算法,给出了基于可辨识矩阵的属性约简算法,并采用了基于可辨识矩阵的二值化数据过滤和贪心算法相结合的规则约简算法。通过属性约简和规则约筒,得出决策规则。最后在排水管路运行风险评估方面给出了应用算例。  相似文献   

14.
在工业过程建模中,传统的建模方法依赖数学模型.当实际系统模型难于用解析式精确表达时,智能建模成为研究热点之一.对具有非线性、时变性、不精确性等复杂系统,智能建模弥补了机理建模、辨识建模等方法的不足,能够避开数学表达式模型.模糊建模的隶属函数不容易得到,而粗糙集能直接从数据库中提取规则,不需要任何先验知识.但粗糙集不能处理连续属性,需要将属性离散化.对水泥回转窑控制系统进行建模,首先应用思维进化算法对决策表中的连续属性进行离散化,然后利用粗糙集理论化简决策表,提取最优的决策规则,最后分析决策规则,得出结论,说明该建模方法的可行性,且由此建模方法得到的决策规则覆盖度较高.  相似文献   

15.
不完备信息条件下地下管线震害预测的粗糙集方法   总被引:1,自引:1,他引:0  
为有效解决城市抗震防灾规划中信息资料不完备的地下管线震害预测问题,首先,采用ROUSTIDA算法对地下管线决策信息表进行补齐;其次,采用改进的贪心算法进行决策表离散化,利用基于信息熵的启发式算法进行属性约简,抽取评价知识,形成规则,并根据规则库进行地下管线震害预测分析;最后,以泉州市地下管线实际情况为例进行分析,并将该模型预测结果与地下管线震害分析的理论法计算结果对比分析,识别准确率达到90%,说明了所提方法的有效性和可行性.  相似文献   

16.
基于非结构网格上控制方程的离散思想,提出了曲线网格上低浓度挟沙水流控制方程离散的新方法.该方法采用有限体积法对控制方程进行离散,用基于同位网格的SIMPLE算法处理水流运动方程中水深和速度的耦合关系,且不需要对控制方程进行坐标转换,因而离散方程的形式简单,物理概念清晰,所得到的离散格式既适用于正交曲线网格还适用于非正交曲线网格,能够适应天然河道这类几何形状复杂的物理边界,从而使编程和计算变得更加简单有效.采用海河流域漳河的实测资料进行了验证计算,计算所得的水位、流速与河床冲淤变形与实测资料基本一致.  相似文献   

17.
基于粗糙集和神经网络的机械故障诊断研究   总被引:1,自引:0,他引:1  
提出了粗糙集理论与神经网络结合的机械故障诊断方法,研究了连续属性离散化的SOM方法和条件属性约简的差别矩阵方法,归纳了构建神经网络需考虑的关键问题,用一个算例验证了方法的有效性.结果表明:粗糙集能有效地约简冗余信息,简化神经网络的结构,缩短网络的训练时间,提高诊断的效率;SOM网络能将连续性输入映射成具有理想聚类结果的离散性输出,并能保持数据间的拓扑结构不变;利用差别矩阵对决策表进行约简,结果准确可靠;BP神经网络泛函逼近能力强,能快速准确地完成特征空间到故障空间的映射.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号