首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
聚类技术就是将数据分为自然的群体,并给出每个群的特征描述的一种数据方法。但是传统的聚类算法对高维大规模数据的处理效率不高,张铃教授提出的交叉覆盖算法可以有效地处理大规模的聚类问题,因而本文提出基于覆盖算法的聚类。同时注意到可以用粒度来描述聚类粗细,因此在聚类中引入粒度。  相似文献   

2.
采用构造型神经网络对大规模模式进行聚类,其中利用商空间粒度分析法选择最优粒度聚类。该方法既发挥了构造型神经网络计算复杂度低的优点,又利用了商空间理论选取最优粒度聚类。对大规模复杂数据聚类实验结果表明该方法是实效的。  相似文献   

3.
针对异常入侵检测技术中传统聚类方法需要被检测类大小均衡的问题,在商空间粒度理论的基础上,论述了商空间粒度变换可以使复杂问题在不同的粒度世界求解,最终使整个问题得到简化。分析了商空间划分与聚类操作的相似性,提出了基于商空间的粒度聚类方法。将该方法与入侵检测技术相结合,构建了基于商空间粒度聚类的入侵检测系统,用于对KDD CUP 1999数据集的异常入侵检测,实验结果表明该入侵检测系统的性能明显优于基于传统聚类方法的入侵检测系统,从而证明了该方法的正确性和有效性。  相似文献   

4.
针对异常入侵检测技术中传统聚类方法需要被检测类大小均衡的问题,在商空间粒度理论的基础上,论述了商空间粒度变换可以使复杂问题在不同的粒度世界求解,最终使整个问题得到简化。分析了商空间划分与聚类操作的相似性,提出了基于商空间的粒度聚类方法,并将该方法与入侵检测技术相结合,构建了基于商空间粒度聚类的入侵检测系统,用于对KDD CUP 1999数据集的异常入侵检测。实验结果表明,该入侵检测系统的性能明显优于基于传统聚类方法的入侵检测系统,从而证明了该方法的正确性和有效性。  相似文献   

5.
信息粒度是对信息和知识细化的不同层次的度量。基于信息粒度的聚类分析方法,凭借能够灵活选择粒度结构,消除聚类结果和先验知识之间的不协调性,有效完成聚类任务等优点,成为国内外学者的研究热点之一。从粗糙集、模糊集、商空间3个理论角度与传统聚类算法相结合,阐述并分析了把粒度的思想引入到聚类中的有效算法及其优缺点,并对这样结合后处理高维复杂数据的可行性及有效性做了分析与展望。  相似文献   

6.
基于粒度计算的覆盖算法   总被引:1,自引:0,他引:1  
赵姝  张燕  平张铃 《计算机科学》2008,35(3):225-227
为了更好地解决高维海量数据的分类问题,本文提出一种基于粒度计算的覆盖算法.该算法以粒度计算为理论依据,指出在分析研究某一问题时,可以适当将其属性、论域或者结构粗化,求得某个商空间,在该商空间中抓住事物的本质对其研究,对某些在同一个粗粒度世界无法识别或者彼此特征区别很弱的对象可以换一个粒度世界对其分析,从而全面了解整个问题;以构造性学习算法--覆盖算法为具体实现工具,得到多个商空间中的结果,最终由商空间理论中的函数合成法获得完整结果.实验证明这种基于粒度计算的覆盖算法在解决分类问题时是行之有效的.  相似文献   

7.
聚类的粒度分析   总被引:11,自引:0,他引:11  
阐述聚类中不同粒度分析的意义,给出问题粒度的描述、粒度粗细的概念以及不同粒度间的关系,论证粒度分析的性质和粒度选择的方法,提出了聚类粒度分析法。相关数据的不同粒度聚类结果论证和说明了聚类粒度分析法的实效性。  相似文献   

8.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

9.
朱永红 《微机发展》2007,17(1):123-124
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法———覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

10.
基于粒度原理的蚁群聚类算法   总被引:3,自引:0,他引:3  
朱树人  匡芳君  王艳华 《计算机工程》2005,31(23):162-163,166
在过去10多年中,蚁群算法(AC)的研究和应用取得了很大的进展,大量结果证明了算法的有效性和在某些领域的优势。文章从信息粒度的角度出发,解决了传统聚类算法中对样本“抱团”性质的客观描述和分类算法中分类专家主观先验知识之间的不协调性。并将蚁群系统模型引入聚类模型中,提出了一种基于粒度原理的蚁群聚类新方法。仿真结果表明上述方法是可行和有效的。  相似文献   

11.
基于商空间粒度理论的大规模SVM分类算法   总被引:4,自引:1,他引:3  
利用商空间粒度理论对已有的SVM分类算法进行改进,给出了一种新的SVM分类算法——SVMG。该算法将SVM分类问题划分成两个或多个子问题,从而降低了SVM分类复杂度。实验表明,改进的算法适用于处理大数据量的样本,能在保持分类精度的情况下有效地提高支持向量机的学习和分类速度。  相似文献   

12.
通过研究已有的网格分割和模型简化方法 ,分析三维模型的网格分割中的商空间粒度思想 ,并将商空间粒度计算引入到网格分割中 ,对网格分割过程进行描述 ,提出了基于粒度分层合成技术的网格分割方法。该算法通过分别提取模型中各三角形网格区域的几何特征构成不同的粒度区域 ,再根据粒度合成理论。将这些所形成的粒度组织起来 ,从而实现对三维网格的最终分割 ,为三角网格模型的简化提供了快速有效的方法。实验表明了该算法对于网格分割的有效性和正确性。  相似文献   

13.
何吟  程建 《计算机应用》2013,33(8):2351-2354
当前极化合成孔径雷达(SAR)图像的分类研究中,极化信息的不完全利用是影响极化SAR图像分类效果的重要原因之一。故将商空间粒度合成理论引入到极化SAR图像分类中,通过建立不同的支持向量机(SVM)分类器构建不同的商空间,从多个粒度层面实现对极化信息的综合利用。首先通过不同的极化分解方法得到不同的极化特征,分别对其建立不同的支持向量机分类器进行分类;再根据粒度合成理论对这些商空间进行融合,得到更细粒度上的改进的分类结果。最后,利用AIRSAR图像进行实验比较,算法改进后的结果在地物误分上有明显的抑制,各类别分类正确率都有所提高。  相似文献   

14.
商空间粒度理论给我们提供了一种研究不同粒度世界的方法,通过粗细粒度的转换,能够满足不同层次的需求。本文提出一种基于商空间的模糊聚类分析模型,结合了商空间粒度理论、分层递阶结构和模糊综合评价模型的思想。最后给出应用实例对客户进行细分,实验证明该模型在解决多维数据分类问题时是有效合理的。  相似文献   

15.
邵伦  周新志  赵成萍  张旭 《计算机应用》2018,38(10):2850-2855
K-means算法是被广泛使用的一种聚类算法,传统的K-means算法中初始聚类中心的选择具有随机性,易使算法陷入局部最优,聚类结果不稳定。针对此问题,引入多维网格空间的思想,首先将样本集映射到一个虚拟的多维网格空间结构中,然后从中搜索出包含样本数最多且距离较远的子网格作为初始聚类中心网格,最后计算出各初始聚类中心网格中所包含样本的均值点来作为初始聚类中心。此法选择出来的初始聚类中心与实际聚类中心拟合度高,进而可据此初始聚类中心稳定高效地得到最终的聚类结果。通过使用计算机模拟数据集和UCI机器学习数据集进行测试,结果表明改进算法的迭代次数和错误率比较稳定,且均小于传统K-means算法测试结果的平均值,能有效避免陷入局部最优,并且聚类结果稳定。  相似文献   

16.
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即QMSVM算法。对训练集中多数类样本进行聚类结构划分,所得划分结果和少数类样本合并进行线性支持向量机(SVM)学习,从而获取多数类样本的支持向量和错分的样本粒;另一方面,获取少数类样本的支持向量和错分的样本,进行SMOTE采样,最后把上述得到的两类样本合并进行SVM学习,这样来实现学习数据集的再平衡处理,从而得到更加合理的分类超平面。实验结果表明,和其他几种算法相比,所提算法虽在正确分类率上有所降低,但较大改善了g_means值和acc+值,且对非平衡率较大的数据集效果会更好。  相似文献   

17.
基于信息粒度的文本聚类算法   总被引:1,自引:0,他引:1  
根据文本对象数据的高维性,稀疏性的特点,提出一种基于信息粒度原理的文本聚类方法.首先在给出文本的稀疏特征,文本的稀疏特征向量,文本的稀疏相似度,等价关系隶属度,广义的等价关系等定义的基础上,利用信息粒度原理生成初始聚类,然后提出并理论推导类间相似度的计算方法,进行类的归并.该算法聚类过程不依赖于输入样本的排列顺序,文本数据的有效压缩提高了算法的执行效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号