首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
决策表中基于条件信息熵的近似约简   总被引:2,自引:1,他引:2       下载免费PDF全文
杨明 《电子学报》2007,35(11):2156-2160
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试.  相似文献   

2.
不完备信息系统中知识约简的一种启发式算法   总被引:6,自引:0,他引:6  
不完备信息系统中的知识获取是粗集理论应用的难点。通过引入信息熵和条件信息熵,对信息系统中属性的必要性进行了定义;提出了一种基于条件信息熵的知识约简启发式算法,并指出该算法的时间复杂度是多项式的。通过实例说明,该算法能得到信息表的约简和决策表的最小相对约简。  相似文献   

3.
基于粗糙集和遗传算法的知识发现方法   总被引:4,自引:0,他引:4  
粗糙集理论是一种处理不确定和不精确问题的新型数学工具,为数据挖掘提供了一条崭新的途径。提出了结合粗糙集理论和遗传算法的知识发现方法。首先通过粗糙集理论对数据进行预处理,在实现属性约简中采用了遗传算法,以提高搜索效率,然后进行规则提取。以农业病虫害诊断知识发现应用为实例说明了该方法的可行性。  相似文献   

4.
基于熵的粗糙集属性简约算法   总被引:5,自引:0,他引:5  
本文定义了四种条件熵,并在此基础上提出了四种基于熵的方法,以用于粗糙集数据分析中的属性简约。举例说明了这四种基于熵的属性简约算法各自的优缺点。最后对两个实际数据库进行了测试,结果表明了所提出的基于熵的属性简约算法的有效性。  相似文献   

5.
本文将基于分辨矩阵的二元矩阵和基于属性重要度的启发式属性约简算法结合起来,提出了一种新颖的针对不完备信息系统的属性约简算法。该算法用条件属性和决策属性之间的依赖度来度量属性重要度,进行启发式约简。该算法将属性约简问题转化为寻找能够覆盖决策属性的二元矩阵的二元矩阵集合问题。通过实例检验,该算法是有效的。  相似文献   

6.
该文在利用隶属度和犹豫度计算直觉模糊逻辑命题真值的对称合成方法的基础上,提出了一种基于条件熵的直觉模糊条件推理新算法。将直觉模糊条件推理规则的前件和后件与决策信息系统的条件属性和决策属性等价起来,条件属性、决策属性和推理规则均视为直觉模糊命题,直觉模糊命题的真实程度转化成一种决策规则前件对后件的条件熵的度量,并给出了条件熵的范围,从而确定直觉模糊命题的真实程度的范围。  相似文献   

7.
System Entropy and Its Application in Feature Selection   总被引:5,自引:3,他引:5  
1 IntroductionFeatureselection ,ideally ,istoselecttheopti malfeaturesubsetfromacandidatesettodescribethetargetconception .Peopleusuallypaymuchat tentiontofeatureselectionbecauseofitspotentialofsimplifyingthestructureofasystem ,speedinguptheprocessofruleinduction ,reducingthecostofinstanceclassificationandimprovingtheperfor manceofthelearnedresults.Theoptimalfeaturesubsetofasystemisusuallymini featurebiased ,i.e.itprefersdescribingasystemwithfeaturesasfewaspossible[1 ] .Unfortunately ,theprob…  相似文献   

8.
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度.  相似文献   

9.
网格计算的资源管理涉及到大量的互联网资源,为了有效管理与应用系统资源,需要研究相应的资源管理模型。基于此探讨了粗糙集理论的相关算法,在此基础上提出了一个粗糙集理论与数据挖掘问题相结合的应用模型。在研究中对该模型进行了模拟数据实验测试,结果与算法的理论结果一致,为粗糙集理论在网格计算领域的应用做了一些力所能及的尝试。  相似文献   

10.
11.
分析了数据融合系统的内在特点,建立了数据融合系统性能评估的综合评估指标体系,提出了一种基于粗糙集和修正熵权的多层次综合评估模型.采用粗糙集理论对指标数据进行属性约减,消除冗余指标,计算属性权重,并对二级指标熵权进行修正;利用层次分析法计算主观权重对一级指标熵权进行修正.实例验证表明,该方法有效可行,提高了评估结果的客观性与可信性,为数据融合系统的开发、论证和实际使用提供了科学的理论决策依据.  相似文献   

12.
图表示下的知识约简   总被引:1,自引:0,他引:1       下载免费PDF全文
 知识约简主要有代数表示下的知识约简和信息表示下的知识约简.本文提出图表示下的知识约简,给出图表示下求最小约简的完备递归算法.借鉴人工智能理论中的图搜索技术,提出旋转剪枝和回溯剪枝两个搜索算子求最小约简,并证明了在这种表示下求最小约简的完备性,理论分析和实验结果表明,在图表示下求最小约简是有效可行的.  相似文献   

13.
张弘  范九伦 《现代电子技术》2010,33(20):49-53,56
基于“灰度-梯度共生矩阵”模型,在现有最大条件熵图像阈值法的基础,引入加权系数进行改进。为了解决权值选取问题,以图像分割质量评价的均匀性测度为评价指标,采用自适应粒子群算法对权系数进行优化选择,进而获得最优的分割阈值。实验结果表明,与二雏最大熵、最大条件熵算法相比,该方法能够获得更佳的分割结果。  相似文献   

14.
很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.  相似文献   

15.
A Method of Attribute Reduction Based on Rough Set   总被引:1,自引:0,他引:1  
The main purpose of oil logging interpretation is to calculate the oil content in formation and set up the exploration scale by determining the lithology and reservoir parameter (porosity, permeability, and saturation ratio)[1]. As the development of digital logging technology and tomography logging technology, more and more well logging data have been produced with exponential increase. Therefore, it is very important to extract the useful or interesting information from the database, and to …  相似文献   

16.
通过时属性的重要性以及属性提供的信息量进行研究,提出一种综合考虑属性重要性和属性的信息量的属性加权平均重要度的概念,并构造在决策表中的基于此重要度的一种新的属性约简方法。通过实例计算表明,该算法简单有效。  相似文献   

17.
续欣莹  张扩  谢珺  谢刚 《电子学报》2017,45(11):2695-2704
最小属性约简是粗糙集理论中属性约简的优化问题.在寻找最小属性约简的问题上,基于粒子群优化的属性约简算法(ARPSO算法)优于传统的属性约简算法.在现有的ARPSO算法中,正域部分通常被作为启发式信息,但是它并不能够很好地衡量不确定性,而互信息是粗糙集理论中一种更有效的度量不确定信息的重要工具.为此,提出基于互信息下的粒子群优化的属性约简算法(MIPSO算法),该算法把互信息作为适应度函数,通过增强粒子能迅速靠近吸引子的这一特性,改进了内嵌区域震荡搜索的粒子群优化算法(简记为RSPSO算法),防止算法较早的陷入局部最优,使得粒子群中的粒子更快的找到最优值,因此使得算法尽可能实现全局收敛.实验结果表明,该算法不仅提高了寻优的能力,加快了算法的速度,提升了算法的精度,而且也能够使得约简后剩余属性的互信息值与约简前所有属性的互信息值近似相等.  相似文献   

18.
为具体挖掘任务选择合适的挖掘算法需要用户对挖掘任务、各种挖掘算法和数据特征都非常熟悉,一般用户是很难达到这个要求的。针对以往研究的系统存在实现困难、不能适应动态添加算法等不足,文中形式化表示数据挖掘算法的适用知识,并基于此设计算法选择交互问题和选择逻辑,实现了一个易于实现的数据挖掘算法选择交互系统。实例验证了系统的有效性。  相似文献   

19.
属性约简的一种新计算方法   总被引:2,自引:0,他引:2  
属性核的确定和属性约简是粗糙集理论研究的两个重要问题。目前的计算方法基本上是通过差别矩阵先求出属性核.然后在属性核的基础上再求出属性约简的。而这种方法具有较高的复杂度。因此在定义了相容样本集.证明了相对正域和相容样本集之间的等价性的基础上,提出属性约筒的一种高效方法。  相似文献   

20.
混合数据的邻域区分度增量式属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
盛魁  王伟  卞显福  董辉  马健 《电子学报》2020,48(4):682-696
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合信息系统进行相关的研究,这促使在混合信息系统下构建相关的增量式属性约简算法.区分度是用于设计属性约简的一种重要方法,本文将传统的区分度在混合信息系统下进行推广,提出邻域区分度的概念,然后分别研究了邻域区分度在混合信息系统下对象增加和对象减少时的增量式学习,最后根据这种增量式学习分别提出了对应的增量式属性约简算法.UCI数据集上的相关实验结果表明,所提出的增量式属性约简比非增量式属性约简能够更快速的更新约简结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号