首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
一种基于粗糙集的聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统聚类算法受数据空间分布影响大且效率较低的问题,提出一种应用粗糙集理论的聚类算法。以信息表中条件属性与决策属性的一致性原理为基础,以数据超立方体、信息熵实现数据属性约简和离散化。在此基础上,利用集合特征向量加法法则运算,只需扫描一次信息表就可实现对数据对象的聚类划分。实验结果表明该算法是有效可行的。  相似文献   

2.
基于粗糙集的混合属性数据聚类算法   总被引:2,自引:0,他引:2  
范黎林  王娟 《计算机应用》2010,30(12):3377-3379
传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。  相似文献   

3.
针对标准鱼群算法易受到初始鱼群随机性的影响,后期收敛速度减慢,处理边界数据能力低,聚类精度低等缺点,提出了基于粒计算与粗糙集的人工鱼群聚类算法。算法引入粒计算理论,并依据粒密度和最大最小距离积法选择初始化人工鱼群避免算法易受随机性的影响;通过结合粗糙集的决策系统和属性约简,提高算法解决边界数据的能力;采用类内紧致性和类间分离度的原则设计适应度函数,并将其作为算法的终止判断条件。实验结果表明:该算法提高了聚类精度,增强了获取全局极值的能力,具有良好的聚类效果。  相似文献   

4.
为了更有效地覆盖粗糙集理论应用到数据挖掘领域,所以对相容关系下的覆盖粗糙集进行了一系列的探究。首先介绍了基于相容关系的覆盖的定义以及基于相容关系的覆盖的特例--最大相容类的集合生成的覆盖的一些性质;其次对相容关系下由所有最大相容类的集合生成的覆盖中的可约元进行了讨论,并对这个条件下覆盖是否为单一的覆盖进行了探讨;接着借助于最小描述提出了k-最简覆盖这个概念,并对其做了简单的探究;最后探究了一些评价相容关系下的覆盖粗糙集的数值标准,并且分析了绝对覆盖率和相对覆盖率相等的情况。  相似文献   

5.
基于粗糙集和小生境遗传算法的层次聚类算法   总被引:1,自引:0,他引:1  
目前大部分聚类算法都面向数值属性,针对符号属性的则比较少.提出了一种新的聚类算法 RNGADHCA,该算法将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明,该算法在面向符号属性进行聚类时能取得较好的聚类效果.  相似文献   

6.
结合粗糙集和模糊聚类方法的属性约简算法   总被引:5,自引:2,他引:5  
本文针对粗糙集理论的属性约简算法进行了研究。结合模糊聚类方法,提出了一个新的属性约简算法,用户可以根据实际决策需要和领域知识更改阈值λ,从而得到用户满意的属性约简结果。最后利用该文的算法给出了一个实例的约筒结果。  相似文献   

7.
一种基于层次聚类的属性全局离散化算法   总被引:1,自引:0,他引:1  
本文摒弃了以往利用断点集来进行离散化的算法思想,提出了一种新的基于粗糙集和分裂的层次聚类的全局离散化算法.本算法在层次聚类的基础上考虑不同连续属性离散化结果间的互补性和相关性,在不改变原信息系统不可分辨关系的前提下通过增类减类进行全局离散化.实验表明该算法具备了删除不必要属性的能力,提高了离散化的精度,更便于属性约简.  相似文献   

8.
谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显.现有谱聚类算法的聚类结果多为精确集,而真实数据集中重叠现象广泛存在.基于粗糙集理论提出了一种新的谱聚类算法,其主要思想是对谱聚类算法进行粗糙集扩展,使得聚类结果成为具有下近似和上近似定义的、类与类之间存在重叠区域的结构.实验表明,该算法与现有的谱聚类算法相比,稳定性和准确率都有一定的提高.  相似文献   

9.
在聚类分析过程中,属性特征在聚类过程中并不是同等重要的,有些特征甚至是冗余的,如果特征选取不适当,会使很多分类方法的效果变差.因此正确选择对于聚类重要性大的特征.对于提高聚类效果是非常重要的.基于此,该文提出了一种新的基于粗糙集相似模型的加权聚类算法.试验结果证明,该算法可以达到比传统算法更优的分类结果.  相似文献   

10.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

11.
基于改进遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的主要内容之一,为了能够有效地获取决策表中属性最小约简,在分析属性约简的方法与遗传算法的基础上,将属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法.通过构造新的变异算子来引入启发式信息,体现了启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度.实验结果表明,该方法能快速有效地求出决策表的最小约简.  相似文献   

12.
基于粗糙集理论的属性约简算法   总被引:4,自引:1,他引:4  
粗糙集理论是一种新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的.从大量数据发现知识时,属性约简是一个关键问题.在理解和分析基于粗糙集理论的数据挖掘算法基础上,提出了一个基于属性依赖度的属性约简算法.实验结果表明,该算法能更有效地对决策系统进行约简.  相似文献   

13.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。  相似文献   

14.
一种结合粗糙集和Cobweb的聚类器   总被引:2,自引:0,他引:2  
提出了一种有效的结合粗糙集和Cobweb的聚类算法CRSC。针对Cobweb的不足,引入了粗糙集理论求解属性-值对组的一个最佳归约集,然后结合Cobweb算法构建分类树。实验表明,该算法在不降低准确性的条件下,较之传统的聚类算法提高了效率。  相似文献   

15.
树突状细胞算法(DCA)在应用于入侵检测时,需要对网络监测数据进行约简,以降低系统负担,提高检测效率。提出一种结合粗糙集属性约简和DCA的异常入侵检测方法。采用粗糙集属性重要度对数据集进行属性约简,产生DCA输入信号,而后利用DCA算法进行入侵检测。通过KDD CUP99数据集对所提出的改进算法进行验证,结果表明,算法在保证检测率的前提下,显著降低了误报率。算法实现了入侵检测特征的自动提取,显著减少了所需检测的特征数目,加快了算法运行速度,具有良好的综合性能。  相似文献   

16.
属性约简是粗糙集合研究的重要内容之一。为了能够有效地获取决策表中属性最小相对约简,提出了一种基于GA-PSO的属性约简算法。该算法以条件属性对决策属性的支持度为基础,求解核属性,把所有的条件属性(除去核属性)加入粒子群算法的初始种群中,并用遗传算法对不满足适应度条件的粒子进行交叉变异操作。实验结果表明,该算法在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够快速有效地获得最小相对属性集。  相似文献   

17.
结合模糊集理论的粗糙集属性约简算法*   总被引:1,自引:0,他引:1  
结合模糊关系的理论,对粗糙集理论的属性约简算法进行研究,提出了一个新的属性约简算法,并给出了一个应用实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号