首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 137 毫秒
1.
针对微阵列表达数据集中基因-基因之间存在复杂相关关系的问题,基于随机森林变量重要性分数,提出了一种新的加权K-均值基因聚类算法。首先,以微阵列表达数据中的样本为对象、基因为特征,训练随机森林分类器,计算每个基因的变量重要性分数;然后,以基因为对象、样本为特征、基因的变量重要性分数为权重进行K-均值聚类。在Leukemia、Breast、DLBCL等3个微阵列表数据集上进行了实验,结果表明:所提出的加权K-均值聚类算法与原始的K-均值聚类算法相比,类间距离与总距离的比值平均高出17.7个百分点,具有更好的同质性和差异性。  相似文献   

2.
K-均值聚类算法在关系数据库中的应用   总被引:2,自引:0,他引:2  
为实现K-均值聚类算法在关系数据库中的应用,对K-均值通用算法进行了改进,通过介绍把K-均值聚类算法和关系数据库管理系统(RDBMS)相结合的一种思想,目标是允许K-均值方法对关系DBMS内部的大数据集进行聚集.分析证明,改进后的K-均值聚类算法能够获得更好的聚类结果.  相似文献   

3.
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1) 需要预先知道聚类的数量;2) 对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。  相似文献   

4.
为了提高噪声干扰彩色图像分割的鲁棒性,给出一种基于中智模糊聚类的彩色图像改进分割算法。将像素空间邻域信息嵌入现有的中智模糊C-均值聚类目标函数,利用马氏距离代替欧氏距离,度量中智模糊聚类中样本与聚类中心之间的差异程度,获得适合彩色图像分割的模糊聚类目标函数,并采用拉格朗日乘子法获取隶属度和聚类中心的迭代求解表达式。对彩色图像添加高斯噪声和椒盐噪声,图像分割测试结果表明,所给算法相比模糊C-均值聚类算法和基于马氏距离的中智模糊聚类算法有更强的鲁棒性。  相似文献   

5.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

6.
为了有效地实现网络虚拟环境的个性化信息推荐,提出一种针对网络三维虚拟环境的用户访问模式聚类算法,即基于多目标粒子群优化的模糊C-均值聚类算法(MOPSO-based FCM, MPF)。MPF算法结合了粒子群优化算法(particle swarm optimization, PSO)与模糊C 均值算法(fuzzy C-means, FCM)的优点,通过PSO的全局空间搜索避免了FCM算法对初始值、噪声数据敏感与容易陷入局部最优等。为了改善聚类效果,在PSO中设计一个基于双目标(最小化类内距离与最大化类间距离)的粒子适应度函数。最后用标准数据集与模拟数据集分别对MPF算法进行性能测试,实验结果表明:本算法在聚类精度方面表现良好。  相似文献   

7.
针对日益严峻的大数据处理时间长、执行速率低等问题,通过深入分析,提出了一种提高大规模数据聚类效率的方法。以K-均值聚类算法为原型,利用Map Reduce模型在大规模数据处理方面的优势,对原有算法进行并行化改进,设计出一种基于Hadoop分布式云平台的K-均值聚类Map Reduce模型。应用此模型,对淘宝用户仿真数据进行聚类试验,试验结果表明,对K-均值聚类算法的Map Reduce模型实现后,性能优于原算法性能,缩短了聚类时间,提高了聚类效率,特别适于对海量数据进行聚类处理。  相似文献   

8.
针对核空间模糊局部信息C-均值聚类算法(KWFLICM)对低对比度图像抗噪性差的不足,提出一种基于噪声距离的核空间模糊局部信息C-均值聚类算法。该算法在KWFLICM算法的基础上改变隶属度约束条件并引入噪声距离δ获得一种改进的聚类目标函数,并借鉴现有噪声聚类思想构造出具有良好抗噪性的模糊聚类迭代隶属度和聚类中心表达式,最后给出相应的聚类分割算法。实验结果表明,该改进算法对于椒盐噪声干扰的对比度较弱的灰度图像比KWFLICM聚类分割算法更有优势。  相似文献   

9.
未确知均值聚类   总被引:1,自引:0,他引:1  
利用未确知系统理论分析特征对样本分类所作贡献,定义特征的分类权重,并作为启发性知识用于确定样本与各类间的加权距离及样本属于各类的隶属度,建立未确知均值聚类算法。IRIS数据检验表明,未确知均值聚类算法误判样本数少、收敛速度快、鲁棒性好,是一种实用、有效的无监督聚类算法。  相似文献   

10.
未确知均值聚类   总被引:2,自引:0,他引:2  
利用未确知系统理论分析特征对样本分类所作贡献,定义特征的分类权重,并作为启发性知识用于确定样本与各类间的加权距离及样本属于各类的隶属度,建立未确知均值聚类算法。IRIS数据检验表明,未确知均值聚类算法误判样本数少、收敛速度快、鲁棒性好,是一种实用、有效的无监督聚类算法。  相似文献   

11.
针对基于内容的视频检索中的镜头聚类问题,采用了一种基于模拟退火思想改进的K均值聚类算法.该方法提取视频帧的时间信息、均值、方差、偏度和信息熵等颜色直方信息作为特征,利用模拟退火算法全局寻优的能力来改善K均值聚类易陷入局部极值的缺点,从而提高视频镜头聚类的准确性.理论分析和实验结果表明该方法是一种有效的视频镜头聚类算法.  相似文献   

12.
在基于高斯混合模型(GMM)的声纹识别算法中,K-means聚类算法是GMM模型参数初始化常用的方法之一。传统K-means算法在聚类过程中采用几何距离进行分类,忽略了类中各矢量的分布不同对聚类结果的影响,常常得不到令人满意的识别结果。文中对传统K-means算法进行了改进,并将改进后的K-means算法与GMM结合应用到声纹识别系统中。实验结果表明,改进的K-means算法与传统的算法相比具有更好的识别效果。  相似文献   

13.
According to the characteristics of sonar image data with manifold feature, the sonar image detection method based on two-phase manifold partner clustering algorithm is proposed. Firstly, K-means block clustering based on euclidean distance is proposed to reduce the data set. Mean value, standard deviation, and gray minimum value are considered as three features based on the relatinship between clustering model and data structure. Then K-means clustering algorithm based on manifold distance is utilized clustering again on the reduced data set to improve the detection efficiency. In K-means clustering algorithm based on manifold distance, line segment length on the manifold is analyzed, and a new power function line segment length is proposed to decrease the computational complexity. In order to quickly calculate the manifold distance, new all-source shortest path as the pretreatment of efficient algorithm is proposed. Based on this, the spatial feature of the image block is added in the three features to get the final precise partner clustering algorithm. The comparison with the other typical clustering algorithms demonstrates that the proposed algorithm gets good detection result. And it has better adaptability by experiments of the different real sonar images.  相似文献   

14.
15.
基于K均值聚类的定位算法分析   总被引:1,自引:0,他引:1  
李炜 《广西工学院学报》2012,23(3):45-48,76
在描述了聚类算法的基本思想和概念的基础上,介绍了一种常见的聚类算法—K均值和K中心点聚类算法,通过处理认知无线电网络中主用户定位在海量数据中应用K均值聚类算法,对该算法进行分析,仿真结果表明:与传统的主用户定位算法相比,使用K均值聚类算法能够有效地提高定位精度和降低定位算法的复杂度.  相似文献   

16.
针对图像分割中K均值算法全局搜索能力差、初始聚类中心选择敏感的问题,提出了一种将自适应人类优化算法与K均值算法相结合的聚类算法.该算法利用自适应人类学习优化算法初始化聚类中心,提高K均值算法的稳健性.结果表明,该算法聚类得到的标准差相比传统K均值算法和基于粒子群K均值(PSO-Kmeans)算法分别小两个数量级和一个数量级,同时图像分割得到的PSNR值均较高,具有算法收敛速度更快,聚类质量更好,图像分割效果更好,适应性更强的优点.  相似文献   

17.
一种基于粗糙集的K-means聚类算法   总被引:2,自引:0,他引:2  
对粗糙集进行了相关研究,并提出了一种以粗糙集理论为基础的K-平均聚类算法,该算法以信息表中条件属性和决策属性的一致性原理为基础,应用粗糙集的属性约简算法消除冗余属性,利用各属性重要度确定其权值,在此基础上应用改进的K-平均算法进行聚类分析.该方法的优势在于消除了不重要的属性,赋予了各属性权值,使聚类更有效,更客观.实验结果表明,该方法是有效的.  相似文献   

18.
神经网络训练集中含有大量相似样本不但增加了网络的训练时间还对网络泛化能力存在较大影响,合理的选择样本集训练神经网络模型影响着建模的效率。根据实际应用中神经网络学习样本具有的内在特征和规律性,提出了一种基于自组织映射(SOM)神经网络的K-均值聚类算法优选神经网络样本,算法的主要思想是通过对样本数据的聚类分析,剔除孤立样本后挑选出具有代表性的样本训练神经网络。实验结果表明,相对随机选择法而言,本算法能够有效地减少训练样本的数目,提高建模效率。  相似文献   

19.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

20.
该文应用蚊群算法和支持向量机实现多光谱遥感图像分类.首先提取出多光谱遥感图像的光谱特征、纹理特征和形状特征,然后利用蚁群优化算法从提取出的多维特征空间中选择最优的特征子集向量,最后将特征子集作为支持向量机分类器的输入量实现分类.实验结果显示,较传统的K均值方法文章给出的方法能够提高遥感图像的分类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号