共查询到20条相似文献,搜索用时 15 毫秒
1.
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试. 相似文献
2.
3.
4.
5.
本文将基于分辨矩阵的二元矩阵和基于属性重要度的启发式属性约简算法结合起来,提出了一种新颖的针对不完备信息系统的属性约简算法。该算法用条件属性和决策属性之间的依赖度来度量属性重要度,进行启发式约简。该算法将属性约简问题转化为寻找能够覆盖决策属性的二元矩阵的二元矩阵集合问题。通过实例检验,该算法是有效的。 相似文献
6.
7.
System Entropy and Its Application in Feature Selection 总被引:5,自引:3,他引:5
ZHAO Jun~ 《中国邮电高校学报(英文版)》2004,11(1)
1 IntroductionFeatureselection ,ideally ,istoselecttheopti malfeaturesubsetfromacandidatesettodescribethetargetconception .Peopleusuallypaymuchat tentiontofeatureselectionbecauseofitspotentialofsimplifyingthestructureofasystem ,speedinguptheprocessofruleinduction ,reducingthecostofinstanceclassificationandimprovingtheperfor manceofthelearnedresults.Theoptimalfeaturesubsetofasystemisusuallymini featurebiased ,i.e.itprefersdescribingasystemwithfeaturesasfewaspossible[1 ] .Unfortunately ,theprob… 相似文献
8.
郑燕玲 《微电子学与计算机》2011,28(8)
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度. 相似文献
9.
网格计算的资源管理涉及到大量的互联网资源,为了有效管理与应用系统资源,需要研究相应的资源管理模型。基于此探讨了粗糙集理论的相关算法,在此基础上提出了一个粗糙集理论与数据挖掘问题相结合的应用模型。在研究中对该模型进行了模拟数据实验测试,结果与算法的理论结果一致,为粗糙集理论在网格计算领域的应用做了一些力所能及的尝试。 相似文献
10.
11.
12.
13.
基于“灰度-梯度共生矩阵”模型,在现有最大条件熵图像阈值法的基础,引入加权系数进行改进。为了解决权值选取问题,以图像分割质量评价的均匀性测度为评价指标,采用自适应粒子群算法对权系数进行优化选择,进而获得最优的分割阈值。实验结果表明,与二雏最大熵、最大条件熵算法相比,该方法能够获得更佳的分割结果。 相似文献
14.
很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度. 相似文献
15.
A Method of Attribute Reduction Based on Rough Set 总被引:1,自引:0,他引:1
LI Chang-biao SONG Jian-ping 《中国电子科技》2005,3(3):234-237
The main purpose of oil logging interpretation is to calculate the oil content in formation and set up the exploration scale by determining the lithology and reservoir parameter (porosity, permeability, and saturation ratio)[1]. As the development of digital logging technology and tomography logging technology, more and more well logging data have been produced with exponential increase. Therefore, it is very important to extract the useful or interesting information from the database, and to … 相似文献
16.
17.
最小属性约简是粗糙集理论中属性约简的优化问题.在寻找最小属性约简的问题上,基于粒子群优化的属性约简算法(ARPSO算法)优于传统的属性约简算法.在现有的ARPSO算法中,正域部分通常被作为启发式信息,但是它并不能够很好地衡量不确定性,而互信息是粗糙集理论中一种更有效的度量不确定信息的重要工具.为此,提出基于互信息下的粒子群优化的属性约简算法(MIPSO算法),该算法把互信息作为适应度函数,通过增强粒子能迅速靠近吸引子的这一特性,改进了内嵌区域震荡搜索的粒子群优化算法(简记为RSPSO算法),防止算法较早的陷入局部最优,使得粒子群中的粒子更快的找到最优值,因此使得算法尽可能实现全局收敛.实验结果表明,该算法不仅提高了寻优的能力,加快了算法的速度,提升了算法的精度,而且也能够使得约简后剩余属性的互信息值与约简前所有属性的互信息值近似相等. 相似文献
18.
为具体挖掘任务选择合适的挖掘算法需要用户对挖掘任务、各种挖掘算法和数据特征都非常熟悉,一般用户是很难达到这个要求的。针对以往研究的系统存在实现困难、不能适应动态添加算法等不足,文中形式化表示数据挖掘算法的适用知识,并基于此设计算法选择交互问题和选择逻辑,实现了一个易于实现的数据挖掘算法选择交互系统。实例验证了系统的有效性。 相似文献
19.
属性约简的一种新计算方法 总被引:2,自引:0,他引:2
属性核的确定和属性约简是粗糙集理论研究的两个重要问题。目前的计算方法基本上是通过差别矩阵先求出属性核.然后在属性核的基础上再求出属性约简的。而这种方法具有较高的复杂度。因此在定义了相容样本集.证明了相对正域和相容样本集之间的等价性的基础上,提出属性约筒的一种高效方法。 相似文献
20.
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合信息系统进行相关的研究,这促使在混合信息系统下构建相关的增量式属性约简算法.区分度是用于设计属性约简的一种重要方法,本文将传统的区分度在混合信息系统下进行推广,提出邻域区分度的概念,然后分别研究了邻域区分度在混合信息系统下对象增加和对象减少时的增量式学习,最后根据这种增量式学习分别提出了对应的增量式属性约简算法.UCI数据集上的相关实验结果表明,所提出的增量式属性约简比非增量式属性约简能够更快速的更新约简结果. 相似文献