首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于粗糙集的多变量决策树构造方法   总被引:77,自引:2,他引:77  
苗夺谦  王珏 《软件学报》1997,8(6):425-431
本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策树(ID3)方法进行了比较,结果表明前者比后者更简单.同时,对几种多变量决策树方法做了初步的对比分析.  相似文献   

2.
在数据挖掘中,分期是一个很重要的问题,有很多流行的分类器可以创建决策树木产生类模型。本文介绍了通过信息增益或熵的比较来构造一棵决策树的数桩挖掘算法思想,给出了用粗糙集理论构造决策树的一种方法,并用曲面造型方面的实例说明了决策树的生成过程。通过与ID3方法的比较,该种方法可以降低决策树的复杂性,优化决策树的结构,能挖掘较好的规则信息。  相似文献   

3.
一种基于粗糙集的最小约简算法   总被引:4,自引:6,他引:4  
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。一种新的数据分析方法——粗糙集理论被提出。该理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。文中首先对近年兴起的粗糙集的基本概念进行了叙述,在此基础上运用粗糙集理论提出一种新的约简算法。  相似文献   

4.
基于离散度的决策树构造方法   总被引:1,自引:0,他引:1  
在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概念在决策树构造过程中选择划分属性,设计了基于离散度的决策树构造算法DSD.DSD算法可以解决WMR方法在实际应用中的局限性.在UCI数据集上的实验表明,该方法构造的决策树精度与基于信息熵的方法相近,而时间复杂度则优于基于信息熵的方法.  相似文献   

5.
首先分析了粗糙集理论和神经网络这两种理论的特点及其互补性,然后提出了一种构造组合分类器的新方法C3RST。新方法包括两个步骤,先对训练数据集进行约简,以此确定单个神经网络分类器的结构以及在组合分类器中要包含的分类器数目;然后将这些分类器组合起来,组合过程中各单个分类器的权值由粗糙集理论中的基本概念——属性重要性来决定。最后,在一些标准数据集上做实验验证C3RST的分类性能,结果表明该方法是有效的。  相似文献   

6.
属性约简是粗糙集理论研究的核心问题之一,而且现已证明寻找一个决策表的最小约简是NP-hard问题.针对变精度粗糙集理论的属性约简问题,从相对可辨识矩阵,属性的重要度作为启发式的信息,给出变精度粗糙集的属性约简算法的改进,在一定程度上简化了属性约简的计算,提高了属性约简的效率.最后通过实例证明了改进的算法给出信息系统的属性约简结果的正确性.  相似文献   

7.
一种基于粗糙集构造决策树的新方法   总被引:18,自引:0,他引:18  
在构造决策树的过程中,分离属性选择的标准直接影响分类的效果。基于粗糙集的理论提出了加权平均粗糙度的概念,将其作为选择分离属性的标准。经实验证明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,复杂性低,且能有效提高分类效果。  相似文献   

8.
基于粗糙集理论的权重确定方法研究   总被引:3,自引:4,他引:3  
针对属性权重完全未知且属性值以专家经验给出的多属性决策问题,提出了利用属性重要度计算客观权重的分配方法。根据粗糙集中的相对正域概念,探讨了如何运用属性重要度确定各属性的客观权重。决策者可以通过经验因子的选取来调整客观权重和主观权重所占的比例,通过实例说明该方法更加有效合理。  相似文献   

9.
王蓉  刘遵仁  纪俊 《计算机科学》2017,44(Z11):129-132
传统的ID3决策树算法存在属性选择困难、分类效率不高、抗噪性能不强、难以适应大规模数据集等问题。针对该情况,提出一种基于属性重要度及变精度粗糙集的决策树算法,在去除噪声数据的同时保证了决策树的规模不会太庞大。利用多个UCI标准数据集对该算法进行了验证,实验结果表明该算法在所得决策树的规模和分类精度上均优于ID3算法。  相似文献   

10.
一种基于属性加权的决策树算法   总被引:1,自引:0,他引:1  
ID3算法和C4.5算法是简单而有效的决策树分类算法,但其应用于复杂决策问题上存在准确性差的问题。本文提出了一种新的基于属性加权决策树算法,基于粗集理论提出通过属性对决策影响程度的不同进行加权来构建决策树,提高了决策结果准确性。通过属性加权标记属性的重要性,权值可以从训练数据中学习得到。实验结果表明,算法明显提高了决策结果的准确率。  相似文献   

11.
一种基于粗集理论属性约简的粗化算法   总被引:2,自引:0,他引:2  
本文基于粗集理论,针对知识表达系统提出了一种新的归纳学习方法,对该方法中条件属性的简化进行了详细的讨论,并给出了一种具体的属性约简算法,其特点是简单,容易实现,考虑了属性值代表范围的合理性。  相似文献   

12.
基于粗糙集的学生成绩决策分析   总被引:1,自引:0,他引:1  
基于粗糙集的知识理论可以从现有原始数据出发给出知识的简化.利用粗糙集理论以及其算法,在MATLAB环境下对学生自主学习成绩决策表进行了求解,分析了该决策表的上近似集、下近似集、不可分辨关系、约简、核集、属性依赖度的概念,从而在原始数据的基础上得出了条件属性与决策属性间的关系.  相似文献   

13.
粗糙集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则:本文提出一种基于信息量的属性约简和规则提取的集成算法,并结合汽车里程试验数据进行验证,通过仿真实验,表明了该算法的有效性和可行性。  相似文献   

14.
为了克服目前恶意程序检测存在着在先验知识较少情况下推广能力差的问题,本文提出了对恶意程序检测的粗糙集方法。实验结果表明,在给出有关恶意程序与普通程序的先验知识较少的情况下,仍然具有较好的检测效果。  相似文献   

15.
一种新的基于粗糙集构造决策树的方法   总被引:1,自引:0,他引:1  
单变量决策树算法生成的决策树具有规模庞大、规则复杂且不易理解的不足.采用粗糙集相对核、加权粗糙度的概念和类别因子相结合的方法,提出一种新的决策树生成算法.对于即将生长的节点,若节点样本的类别因子大于给定阈值,则停止生长该节点,如此就有效地避免了划分过细的问题.通过实验说明,该算法比传统的ID3算法生成的决策树更简单、更易于理解、抗噪声能力更强.  相似文献   

16.
信号识别是侦察系统信号处理的目的,是整个雷达对抗信号处理中关键性的一个环节.为解决雷达信号的智能识别问题,研究了将粗糙集和模糊模式识别法紧密结合的雷达信号识别模型,即先用粗糙集属性重要性定义了雷达信号各特征参数的识别权重,再结合模糊模式识别的方法对雷达信号进行匹配识别.该方法既充分运用了原始数据又体现出雷达信号自身的特点,通过实例验证并分析了此法的实用性和有效性.  相似文献   

17.
传统的随机森林在网络入侵检测中收敛速度慢,并且学习性能不够完善。为消除原始入侵检测数据中的冗余信息,提出一种基于信息增益和粗糙集的随机森林入侵检测方法。使用信息增益对数据的各个属性进行相关分析,删除冗余属性,减小属性简约的时间复杂度;利用粗糙集理论从数据中提取分明函数,求得属性简约;使用随机森林分类器进行分类。实验结果表明,该方法收敛速度较快,在召回率和精度方面都要高于传统的随机森林方法,尤其是在训练样本充足的网络环境下,效果更加明显。  相似文献   

18.
随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点.传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响.提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果.  相似文献   

19.
属性约简是粗糙集理论的重要研究内容之一,其中基于区分矩阵的约简算法是一种高效的约简算法,但算法具有很高的空间复杂度.为了减少区分矩阵的空间开销,利用浓缩树结构,结合区分矩阵单个属性一定为核属性的特征,提出改进的生成浓缩树算法,压缩存储区分矩阵中的非空数据项,且不丢失原区分矩阵的所有信息;利用生成的浓缩树结构结合启发式策略,给出属性约简算法.实验结果表明,算法正确有效并且空间复杂度有明显降低.  相似文献   

20.
一种基于粗集理论的分类规则挖掘的实现方法   总被引:8,自引:0,他引:8  
研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。基于粗集理论的分类规则挖掘是一种重要的方法,在分析有关算法的基础上提出一种改进方法,并通过实例证明了该方法的效率有所提高。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号