首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
利用自组织特征映射神经网络进行可视化聚类   总被引:5,自引:0,他引:5  
白耀辉  陈明 《计算机仿真》2006,23(1):180-183
自组织特征映射作为一种神经网络方法,在数据挖掘、机器学习和模式分类中得到了广泛的应用。它将高维输人空间的数据映射到一个低维、规则的栅格上,从而可以利用可视化技术探测数据的固有特性。该文说明了自组织特征映射神经网络的工作原理和具体实现算法,同时利用一个算例展示了利用自组织特征映射进行聚类时的可视化特性,包括聚类过程的可视化和聚类结果的可视化,这也是自组织特征映射得到广泛应用的原因之一。  相似文献   

2.
BK-means:骨架初始解K-means   总被引:2,自引:0,他引:2       下载免费PDF全文
K-means是典型的启发式聚类算法,容易受到初始解的影响而无法获得高质量的聚类结果。骨架是近年来启发式算法设计的研究热点,它是指所有全局最优解中相同的部分,对于提高启发式算法性能具有重要意义。给出的骨架初始解K-means算法(BK-means)的基本思想是:首先利用K-means算法得到一组局部最优解(聚类结果),通过对局部最优解求交得到骨架簇。利用骨架簇构造骨架初始解及新的搜索空间。最后以骨架初始解引导K-means算法在新的搜索空间中搜索聚类结果。在15组仿真数据集和4组实际数据集上的实验结果表明,BK-means算法具有获得高内聚、高分离的聚类结果能力。  相似文献   

3.
基于核方法可在高维特征空间中完成数据聚类,但缺乏对原输入空间聚类中心及结果的直观刻画.提出一种核自组织映射竞争聚类算法.该算法是利用核的特征,导出SOM算法的获胜神经元及权重更新规则,而竞争学习机制依然保持在原输入空间中,这样既解决了当输入样本分布结构呈高度非线性时,其分类能力下降的问题,而且解决了Donald[1]算法导致的特征空间中的获胜神经元在原始输入空间中的原像不存在,而无法对聚类结果利用可视化技术进行解释的问题.实验结果表明,提出的核自组织映射竞争聚类算法在某些数据集中可以获得比SOM算法更好的结果.  相似文献   

4.
提出基于二进制灰狼优化的特征选择与文本聚类算法.为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并与交叉操作,进一步计算最优特征子集;在新特征子集基础上,利用同步考虑余弦相似度和欧氏距离指标的多目标优化K均值算法完成文本聚类,得到最优文本聚类解.实验结果表明,在多数数据集上,该算法可以有效降低特征维度,聚类指标表现更好.  相似文献   

5.
针对K-means聚类算法依赖于初始值并易陷入局部最优值的问题,提出了一种基于改进花朵授粉的K-means聚类算法。该算法首先通过混沌映射的序列作为花朵种群的初值位置,保证花朵种群在搜索空间的多样性、确定性;然后在花朵授粉的后期搜索阶段引入禁忌搜索算法以避免陷入局部最优解;最后将改进后的FPA算法用于优化K-means算法的初值。在五个聚类数据集上的实验结果表明,改进后算法的平均聚类准确率相比于花朵授粉聚类算法提高了12.2%,证明了该算法对于低维数据集具有更好的聚类效果。  相似文献   

6.
图像的自动准确分割是实现黑素细胞瘤图像自动分析的关键.针对皮肤镜黑素细胞瘤图像,提出一种基于改进遗传算法和自生成神经网络(SGNN)相结合的自适应聚类分割算法.首先采用遗传算法选取一组最优的种子样本作为初始神经树;然后通过SGNN对剩余样本进行训练得到一个自生成神经森林;最后令森林中每棵树代表一个类,完成黑素细胞瘤图像的自适应聚类分割.该算法解决了SGNN对样本训练顺序敏感的问题,并能够自适应地确定类别数,聚类过程无需任何人工干预;同时根据解空间的大小设定遗传算法的初始种群规模,并在进化过程中根据个体的变化对种群规模以及交叉率和变异率等遗传控制参数进行动态调整,有效地提高了算法的运行速度.实验结果表明,文中算法稳定性好,聚类结果符合人眼判别的诊断要求.  相似文献   

7.
基于PSO_KFCM的医学图像分割   总被引:1,自引:0,他引:1  
在核模糊聚类算法(KFCM)的基础上,提出了一种新的PSO KFCM聚类算法.新算法利用高斯核函数,把输入空间的样本映射到高维特征空间,利用微粒群算法的全局搜索、快速收敛的特点,代替KFCM算法逐次迭代的过程,在特征空间中进行聚类,克服了KFCM对初始值和噪声数据敏感、易陷入局部最优的缺点.通过对医学图像进行分割,仿真实验结果表明,新算法在性能上比KFCM聚类算法有较大改进,具有更好的聚类效果,且算法能够很快地收敛.  相似文献   

8.
孙志伟  赵政 《计算机应用》2006,26(11):2667-2669
由于非空间属性维数较高,空间聚类算法在处理非空间属性约束时难点首先在于如何为这些非空间属性设定参数,然后是哪些非空间属性在聚类中将起主要作用,并真正影响聚类的结果。对这些问题进行了讨论,并提出使用神经网络中自组织映射的方法来首先选择哪些非空间属性将被优先考虑,使用自组织特征映射(SOFM)方法对非空间属性聚类,最后把非空间属性和空间属性聚类进行合并得到最终的聚类结果的方法。  相似文献   

9.
针对多维数据集,为得到一个最优特征子集,提出一种基于特征聚类的封装式特征选择算法。在初始阶段,利用三支决策理论动态地将原始特征集划分为若干特征子空间,通过特征聚类算法对每个特征子空间内的特征进行聚类;从每个特征类簇里挑选代表特征,利用邻域互信息对剩余特征进行降序排序并依次迭代选择,使用封装器评估该特征是否应该被选择,可得到一个具有最低分类错误率的最优特征子集。在UCI数据集上的实验结果表明,相较于其它特征选择算法,该算法能有效地提高各数据集在libSVM、J48、Nave Bayes以及KNN分类器上的分类准确率。  相似文献   

10.
陆林花 《计算机仿真》2009,26(7):122-125,158
为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类.  相似文献   

11.
蒋勇  谭怀亮  李光文 《计算机应用》2011,31(9):2546-2550
在处理大数据集聚类问题上,谱聚算法因存在占用存储空间大、时间复杂度高的缺陷而难以推广,针对此问题,提出采用多次分割、向上向下双向收缩的QR算法求得特征值对应的特征向量来实现降维,并在此基础上构造映射空间上的样本来实现量子遗传谱聚算法的聚类。该方法通过映射为后续的量子遗传谱聚算法聚类提供低维的输入,而量子遗传算法具有快速收敛到全局最优并且对初始化不敏感的特性,从而可以获得良好的聚类结果。实验结果显示,使用该算法的聚类比谱聚算法、K-means算法、NJW算法等单一方法具有更好的收敛性、稳定性和更高的全局最优。  相似文献   

12.
针对人脑网络状态观测矩阵高维无特征的特点,给出了一种基于深度自动编码器(DAE)的降维算法.利用深度学习网络,将高维的人脑网络空间表达映射到低维的本质特征空间中,为进一步提炼脑网络的动态性能提供了基础.实验结果证明:应用该方法可以达到有效的降维效果,且降维后脑网络状态通过自组织特征映射聚类具有一定的规律性,从而为脑网络的动态特性研究提供了基础.  相似文献   

13.
In this paper, we develop a genetic algorithm method based on a latent semantic model (GAL) for text clustering. The main difficulty in the application of genetic algorithms (GAs) for document clustering is thousands or even tens of thousands of dimensions in feature space which is typical for textual data. Because the most straightforward and popular approach represents texts with the vector space model (VSM), that is, each unique term in the vocabulary represents one dimension. Latent semantic indexing (LSI) is a successful technology in information retrieval which attempts to explore the latent semantics implied by a query or a document through representing them in a dimension-reduced space. Meanwhile, LSI takes into account the effects of synonymy and polysemy, which constructs a semantic structure in textual data. GA belongs to search techniques that can efficiently evolve the optimal solution in the reduced space. We propose a variable string length genetic algorithm which has been exploited for automatically evolving the proper number of clusters as well as providing near optimal data set clustering. GA can be used in conjunction with the reduced latent semantic structure and improve clustering efficiency and accuracy. The superiority of GAL approach over conventional GA applied in VSM model is demonstrated by providing good Reuter document clustering results.  相似文献   

14.
经典的模糊C-均值聚类算法存在对噪声数据较为敏感、未考虑样本属性特征间的不平衡性及对高维数据聚类不理想等问题,而可能性聚类算法虽然解决了噪声敏感和一致性聚类问题,但算法假定每个样本对聚类的贡献程度一样。针对以上问题,提出了一种基于样本-特征加权的可能性模糊核聚类算法,将可能性聚类应用到模糊聚类中以提高其对噪声或例外点的抗干扰能力;同时,根据不同类的具体特性动态计算样本各个属性特征对不同类别的重要性权值及各个样本对聚类的重要性权值,并优化选取核参数,不断修正核函数把原始空间中非线性可分的数据集映射到高维空间中的可分数据集。实验结果表明,基于样本-特征加权模糊聚类算法能够减少噪声数据和例外点的影响,比传统的聚类算法具有更好的聚类准确率。  相似文献   

15.
A novel kernel method for clustering   总被引:10,自引:0,他引:10  
Kernel methods are algorithms that, by replacing the inner product with an appropriate positive definite function, implicitly perform a nonlinear mapping of the input data into a high-dimensional feature space. In this paper, we present a kernel method for clustering inspired by the classical k-means algorithm in which each cluster is iteratively refined using a one-class support vector machine. Our method, which can be easily implemented, compares favorably with respect to popular clustering algorithms, like k-means, neural gas, and self-organizing maps, on a synthetic data set and three UCI real data benchmarks (IRIS data, Wisconsin breast cancer database, Spam database).  相似文献   

16.
一种基于小生境遗传算法的中文文本聚类新方法   总被引:2,自引:0,他引:2  
针对传统c-均值等算法在文本聚类中的缺陷,提出了一种基于小生境遗传算法的中文文本聚类新方法,将文本集的聚类问题转化垄多峰函数的优化问题。以多峰函数的峰值代表文本的聚类中心,聚类的数目不必预先给定。描述了该聚类方法实现文本聚类时适应值函数的构造方法以及小生境半径的动态估计方法。实验结果表明,该方法提高了文本聚类的平均准确率。  相似文献   

17.
An algorithm for optimizing data clustering in feature space is studied in this work. Using graph Laplacian and extreme learning machine (ELM) mapping technique, we develop an optimal weight matrix W for feature mapping. This work explicitly performs a mapping of the original data for clustering into an optimal feature space, which can further increase the separability of original data in the feature space, and the patterns points in same cluster are still closely clustered. Our method, which can be easily implemented, gets better clustering results than some popular clustering algorithms, like k-means on the original data, kernel clustering method, spectral clustering method, and ELM k-means on data include three UCI real data benchmarks (IRIS data, Wisconsin breast cancer database, and Wine database).  相似文献   

18.
核聚类算法   总被引:112,自引:0,他引:112  
该文提出了一种用于聚类分析的核聚类方法,通过利用Mercer核,作者把输入空间的样本映射到高维特征空间后,在特征空间中进行聚类,由于经过了核函数的映射,使原来没有显现的特征突出来,从而能够更好地聚类,该核聚类方法在性能上比以典的聚类算法有较大的改进,具有更快的收敛速度以及更为准确的聚类,仿真实验的结果证实了核聚类方法的可行性和有效性。  相似文献   

19.
Clustering Incomplete Data Using Kernel-Based Fuzzy C-means Algorithm   总被引:3,自引:0,他引:3  
  相似文献   

20.
为提高海量数据挖掘和聚类的效率和精度,以应用于压缩机机械故障智能诊断中.将遗传算法与K均值聚类算法进行互补,提出基于倾斜分类K均值优化数据聚类算法.算法引入倾斜因子,避免较小类数据产生次优解的现象发生.在传统的K均值数据聚类算法基础上,通过倾斜因子排除了少数类局部最优解的干扰,提高遗传算法的收敛速度,也可以避免过早收敛到局部最优解中.仿真实验中以某天然气压气站采集的故障状态下的压缩机振动信号提取的特征量数据作为研究对象,进行数据聚类分析.仿真实验表明,通过改进的数据聚类算法对故障信号关联维特征量进行分类识别,能有效对四类天然气压缩机故障进行诊断分类,准确率能提高18.7%,研究结果在数据优化聚类及在机械故障诊断中的应用中具有良好的指导意义和实践价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号