首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
一种多维数据的聚类算法及其可视化研究   总被引:8,自引:0,他引:8  
任永功  于戈 《计算机学报》2005,28(11):1861-1865
提出了一种基于主次属性划分的聚类方法和一种新的数据可视化方法.首先,利用数据的主属性和次属性的特征值对数据集进行聚类;然后,采用彩色刺激光谱投影到RGB颜色空间的原理,通过色度学中麦克斯韦的三角平面坐标色度图对各聚类结果进行可视化显示.实验证明了文中方法算法简单、容易实现,可视化结果有利于用户全面地理解数据,为数据的预测、决策起到重要作用.  相似文献   

2.
一种基于旋转超盒和引力场融合的聚类算法   总被引:1,自引:0,他引:1  
针对传统聚类算法处理复杂分布数据的不足,提出了一种新型的基于旋转超盒和引力场融合的聚类算法.该算法由1)数据集归一化;2)利用旋转超盒构造初始类别;3)借助引力场概念对初始类别进行融合3个步骤构成.仿真结果表明,该算法在无需聚类数目的情况下,对复杂分布数据具有很好的聚类效果.  相似文献   

3.
提出一种基于动态时间弯曲算法距离度量的探地雷达数据可视化方法,利用动态 时间弯曲算法在时间轴方向上伸缩的优越性,结合可指定类数的聚类算法对探地雷达数据进行 聚类和可视化分析。可用于实测的探地雷达数据集,实验结果表明,相对于传统的聚类算法, 本文算法能得到更好的聚类结果。  相似文献   

4.
当前信息时代的开放性,使信息安全面临着重大威胁,入侵检测系统成为保证网络安全的一种必要手段,而数据挖掘在网络入侵检测领域是一个重要手段,根据数据场的交互式可视化聚类思想,介绍了利用聚类技术进行网络异常检测的方法.  相似文献   

5.
现有的径向布局可视化方法无法有效捕获高维数据的非线性结构.因此,文中提出基于维度扩展和重排的类圆映射可视化聚类方法.利用近邻传播聚类算法和多目标聚类可视化评价指标对高维数据进行维度扩展,然后对扩展后的高维数据进行维度相关性重排,最后利用类圆映射机制降维至二维可视化空间,实现高维数据有效可视化聚类.实验表明,文中提出的维度扩展和重排策略能有效提高类圆映射可视化方法聚类效果,其中的维度扩展策略也能显著提高其它径向布局可视化方法聚类效果,泛化性能较好.此外,相比同类方法,文中方法在可视化聚类准确度、拓扑保持、Dunn指数及效果上优势明显  相似文献   

6.
聚类分析是数据挖掘中的核心技术,利用相关的可视化方法显示聚类结果,将数据分布以直观、形象的图形方式呈现给决策者,使得决策者可以直观地分析数据。I-Miner是一个企业级的数据挖掘工具,利用I-Miner软件进行聚类分析,并用多种方法将聚类结果可视化。通过S语言拓展软件功能,编程实现了K-Medoid算法、SOM算法、SOM与K-Medoids结合的聚类组合算法,尤其是在高维数据的可视化上,实现了星图法和SOM之U矩阵法,弥补软件中聚类和可视化模块较少的不足。  相似文献   

7.
利用自组织特征映射神经网络进行可视化聚类   总被引:5,自引:0,他引:5  
白耀辉  陈明 《计算机仿真》2006,23(1):180-183
自组织特征映射作为一种神经网络方法,在数据挖掘、机器学习和模式分类中得到了广泛的应用。它将高维输人空间的数据映射到一个低维、规则的栅格上,从而可以利用可视化技术探测数据的固有特性。该文说明了自组织特征映射神经网络的工作原理和具体实现算法,同时利用一个算例展示了利用自组织特征映射进行聚类时的可视化特性,包括聚类过程的可视化和聚类结果的可视化,这也是自组织特征映射得到广泛应用的原因之一。  相似文献   

8.
刘芳 《计算机应用研究》2012,29(4):1300-1303
提出了用无监督的自组织映射方法对金融数据进行聚类,并用平行坐标和交互式的圆形平行坐标方法在二维平面上表示出来。用这种方法形成清晰的可视化聚类结果,不仅有效地总结了数据特征,还提高了聚类的可视效果,从而便于发现数据的变化趋势。  相似文献   

9.
聚类是数据挖掘的一种手段,把特征相似的数据聚在一起,论文尝试通过不同的聚类算法对数据集进行聚类,得出不同聚类算法的轮廓系数并对其行分析研究,得出最佳算法,然后确定k值,结果是当k=2时基于K-means聚类算法的情绪聚类效果最好.研究结果可以应用到抑郁症治疗或者心理学领域方面,未来做一个分类器进行快速的情绪分析,可以预...  相似文献   

10.
图的聚类是数据聚类的一种很重要的变体,一方面通常可以用图来表示数据集中数据的相似度;另一方面对大型复杂网络的分析也引起人们越来越多地关注;而且对图进行聚类分析可以增强图的可视性,有助于可视化的分析、观测和导航。将最大最小方法的基本思想应用于非加权图的聚类,提出一种无向连通非加权图的快速聚类方法,该方法具有简单、聚类时间短、运行效率高、对于大型静态图的聚类具有良好的适应性等特点。  相似文献   

11.
秦绪佳  单扬洋  徐菲  郑红波  张美玉 《计算机科学》2018,45(12):262-267, 287
针对全国各省份垃圾处理方式的数据,提出一种混合可视分析方法。为了从多角度分析数据,混合U矩阵、平行坐标以及Small-Multiple 3种可视化技术,设计并实现了3种可视化视图的交互联动。首先,对数据进行聚类处理,将各省份近年的垃圾处理方式划分类别,采用SOM神经网络聚类算法实现聚类。然后,针对SOM聚类结果,采用U矩阵的方式进行可视化,并采用平行坐标描述每个聚类结果的各个属性。为了分析数据的地理属性及时序属性,采用Small-Multiple可视化技术。最后,实现多视图联动、刷新技术等交互方式,帮助用户自行探索数据,实现多视图的交互展示与分析。实验表明,这种混合可视方式可达到较好的多属性交互可视化效果,能够帮助用户了解并分析我国垃圾处理方式的分布及趋势。  相似文献   

12.
A self-organizing map (SOM) is a nonlinear, unsupervised neural network model that could be used for applications of data clustering and visualization. One of the major shortcomings of the SOM algorithm is the difficulty for non-expert users to interpret the information involved in a trained SOM. In this paper, this problem is tackled by introducing an enhanced version of the proposed visualization method which consists of three major steps: (1) calculating single-linkage inter-neuron distance, (2) calculating the number of data points in each neuron, and (3) finding cluster boundary. The experimental results show that the proposed approach has the strong ability to demonstrate the data distribution, inter-neuron distances, and cluster boundary, effectively. The experimental results indicate that the effects of visualization of the proposed algorithm are better than that of other visualization methods. Furthermore, our proposed visualization scheme is not only intuitively easy understanding of the clustering results, but also having good visualization effects on unlabeled data sets.  相似文献   

13.
针对并行密度聚类算法在处理大数据集时存在伸缩困难、参数寻优能力不佳、并行化效率较低等问题,提出一种基于分组和重力搜索优化算法(improve gravitational search algorithm,IGSA)的并行密度聚类算法(densi-ty-based clustering algorithm based on groups and improve gravitational search,MR-GDBIGS).首先,该算法设计了基于图形的分组策略(grouping strategy based on pattern,GSP)来有效划分数据,加速邻域搜索,解决了处理大数据集时伸缩困难的问题;其次,在局部聚类中提出基于位置更新函数(position update function,PUF)的重力搜索优化算法,动态寻找局部聚类中的最优参数,提升了局部聚类的效果;最后,提出基于覆盖树的并行局部簇合并策略(cluster merging strategy by using MapReduce,MR-CTMC),在实现局部簇并行化合并的同时加快了合并局部簇的收敛速度,提升了算法整体的并行化效率.实验结果表明,MR-GDBIGS算法在处理大数据时的聚类效果更佳,且并行化性能更好.  相似文献   

14.
杨涛  管一弘 《计算机应用》2010,30(10):2797-2801
针对人脑组织结构的不确定性和模糊性,提出模糊Gibbs随机场聚类与二维直方图相结合的分割方法。该方法首先利用均值、方差及邻域属性对隶属度函数进行定义,并建立模糊Gibbs随机场;然后以模糊Gibbs随机场作为先验知识、最大后验概率为判别准则来确定每一个像素的类归属以及它属于该类的隶属度,同时用模糊类的质心来更新类中心;最后将类中心引入二维直方图方法中,找到每个类之间的各个阈值点对图像进行分割。通过实验表明该算法能够准确分割出各种脑组织,对噪声的鲁棒性、结果的准确性及平滑性相对于模糊C均值(FCM)算法都有了很大的提高。  相似文献   

15.
一种改进的ART2网络学习算法   总被引:12,自引:1,他引:11  
分析了现有ART2网络存在的问题,提出了一种改进的ART2算法。该算法首先利用样本数据自身来初始化权值,然后按照同一类中的数据点到其聚类中心的距离之和越小(即类内偏差越小),聚类效果越好的原则来设计特征表示场和类别表示场之间的权值修正公式,最后通过比较输入样本和聚类中心的模来有效地利用模式的幅度信息。分析证明了该算法不仅能有效解决模式漂移问题、充分利用幅度信息,而且能提高聚类速度。  相似文献   

16.
传统端元提取算法一般需要人工指定端元数目,易导致多选或漏选端元。利用数据场自然拓扑聚类、可视化的特性,提出了基于数据场的端元提取方法。首先对图像进行分区处理,然后应用数据场思想计算各区域数据点的势能,并分别选择一定数量的特征点,将所有特征点集合成特征图像,再计算特征图像的数据场;最后根据数据场形成的拓扑聚类结构,可视化地提取端元,获得最佳端元的数目和位置。利用Cuprite矿区的AVIRIS数据进行端元提取实验,结果表明:该方法是合理有效的,能够应用于高光谱图像的端元提取中。  相似文献   

17.
5G通讯技术的迅猛发展使工业物联网得到了全面提升, 工业物联网数据规模将越来越大、数据维度也越来越高, 如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题. 提出了一种基于工业物联网数据流自适应聚类方法. 该算法利用微簇之间的高密性, 计算各微簇节点的局部密度峰值以自适应产生宏簇数; 采用引力能量函数对微...  相似文献   

18.
数据聚类是大数据分析的基本手段,传统聚类方法易于陷入局部最优.针对这一问题,提出一种基于改进引力搜索机制GSA的数据聚类算法.定义一种适合于引力搜索进化的聚类解编码方式.为了衡量不同聚类解的差异,设计一种基于汉明距离的引力搜索粒子距离度量方法,有效衡量数据对象在各维度属性上的不同.同时,在粒子速度更新方面,引入加速因子...  相似文献   

19.
吴斐然  陈海东  黄劲  陈为 《软件学报》2014,25(S2):111-118
聚类是研究空间多变量数据的重要工具之一.但是自动聚类算法通常需要用户预设参数然后生成结果,缺乏一种有效的交互机制将用户介入到聚类的过程,使之动态改变参数并对结果进行调整和评估.为此提出一种面向空间多变量数据聚类的可视分析流程,首先运用自动聚类算法对原始三维空间进行聚类,针对三维空间不易交互的缺陷将数据点投影到二维平面进行交互选择和可视编码,设置多种视图使用户实时而全面地理解数据分布和模式,交互地修正聚类结果,并根据一些编码的统计信息来判断结果的合理性和正确性.整个流程是渐进式的,即用户通过迭代逐步细化结果,最终抽取兴趣域.案例分析表明,新的可视分析流程能够有效地提高空间自动聚类算法的精度,也极大地缩短了用户交互的时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号