首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
传统的k-means算法对噪声和孤立点数据是敏感的,少量的该类数据将会影响聚类结果的精度。针对此算法存在的问题,本文提出一种改进的k-means算法,该算法使用基于加权的改进k-means方法确定类中心。实验证明,改进算法大幅度地降低了聚类结果对噪声和孤立点数据的敏感性,提高了聚类正确率。  相似文献   

2.
运用图的孤立点的概念,对传统Rock算法进行了改进,提出了电子商务网站由算法本身自动生成适合的聚类集的方法,并给出了该算法的具体实现,以及与传统Rock算法的对比与分析.实验数据表明,采用Roc改进算法进行聚类要比采用传统的Rock算法具有更好的实际价值.  相似文献   

3.
针对初始聚类中心的选择对于K-均值算法的聚类结果非常敏感,且容易陷入局部极值的缺点,提出利用蚁群聚类算法来搜寻K-均值的初始聚类中心,同时通过在搜索空间增加一组逐渐递减的服从均匀分布的扰动因子,建立基于扰动因子的准则函数下的聚类算法.最后对蚁群聚类算法、K-均值聚类算法以及改进后的算法做了对比实验.实验结果表明,改进后算法的聚类能力更强.  相似文献   

4.
本文针对模糊C均值聚类(FCM)算法在分割噪声图像和含有颜色相近区域的图像时存在的不足,提出了一种结合各向异性均值漂移的模糊c均值聚类(FCM)新算法。该算法在传统的FCM算法中引入了均值漂移(MS)算法,分割图像时利用Ms算法可快速找到峰值点和图像空间信息的优点,对颜色漂移区域和细长区域均能保留更多的图像信息,同时具有较强的抗噪能力。  相似文献   

5.
提出了一种适合在线实时分类并避免过多人为因素干扰的流量分类方法.该方案早期采用DPI技术识别信息流的业务类型,作为后期聚类算法的指导和基准;借鉴OPTICS聚类算法思想,用数据点的个数来衡量稠密度,完成信息流的聚类,可有针对性地为用户提供服务.  相似文献   

6.
针对原始花粉算法寻优精度低,后期收敛速度慢等问题,提出加入高斯白噪声扰动改进花粉算法.利用改进后花粉算法强大的全局搜索能力优化K-means算法的初始聚类中心,通过基于距离的方法消弱孤立点对聚类的影响,并对该算法的性能进行验证和测试.实验结果表明该算法有效地避免了其陷入局部最优,改善了聚类性能.  相似文献   

7.
针对传统K-means聚类算法对初始点敏感性问题,根据数据样本分布,采用启发式的方法选取初始聚类中心点,设计了一种均衡化评价函数,由此函数为准则自动生成聚类数目.通过实验验证了该算法的收敛性.  相似文献   

8.
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CAFCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。  相似文献   

9.
针对提花毛皮样片扫描图像的花型自动识别问题,提出了一种改进的基于空间信息的模糊C均值聚类图像分割算法,该算法利用像点邻域区间的粗糙度和邻域像点的值修正像点与聚类中心的距离,对像点的模糊隶属度函数进行修正,利用修正后的模糊隶属度函数进行聚类中心的迭代计算,获得合理的聚类中心。经多幅提花毛皮样片的花型图像分割实验表明,该算法具有对噪声不敏感的优点,在进行提花毛皮样片扫描图像的花型识别时,能获得较好识别结果。  相似文献   

10.
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。本文主要阐述了K-means的基本算法流程,总结评述了改进的k-means算法的研究现状,以及和经典算法的比较。最后总结了k-means算法存在的一些问题,并指出了改进的方向。  相似文献   

11.
关于聚类已经有一些相当成熟的算法,但是这些算法都要事先给定聚类个数,带有很大的主观性.针对此问题,惩罚次胜者竞争学习算法(RPCL)通过初始化足够多聚类中心,并且把多余的聚类中心排挤到离数据区足够远的地方来自动确定聚类个数.试验表明这种算法在很多情况下有着良好的运用,但是该算法学习速度比较慢,在处理类别界限模糊的数据集时往往得不到正确的分类.针对它存在的问题,用几条模糊控制规则,提出了惩罚次胜者模糊竞争学习算法以达到自动调整次胜者学习速度的目的.实验表明,惩罚次胜者模糊竞争学习算法更优秀.  相似文献   

12.
基于内容的多媒体数据库索引算法研究   总被引:1,自引:0,他引:1  
分析了多媒体数据库信息检索的索引算法,并且对k-means聚类算法中初始聚类数目和聚类中心的设定进行了改进,设计了一种用于大容量图像数据库的索引方法.在1万多幅风景图像数据库上反复进行实验,结果表明该算法能够有效地支持大容量图像数据库的基于内容的检索.  相似文献   

13.
In clustering methods, the estimation of the optimal number of clusters is significant for subsequent analysis. Without detailed biological information on the genes involved, the evaluation of the number of clusters becomes difficult, and we have to rely on an internal measure that is based on the distribution of the data of the clustering result. The Gap statistic has been proposed as a superior method for estimating the number of clusters in crisp clustering. In this study, we proposed a modified Fuzzy Gap statistic (MFGS) and applied it to fuzzy k-means clustering. For estimating the number of clusters, fuzzy k-means clustering with the MFGS was applied to two artificial data sets with noise and to two experimentally observed gene expression data sets. For the artificial data sets, compared with other internal measures, the MFGS showed a higher performance in terms of robustness against noise for estimating the optimal number of clusters. Moreover, it could be used to estimate the optimal number of clusters in experimental data sets. It was confirmed that the proposed MFGS is a useful method for estimating the number of clusters for microarray data sets.  相似文献   

14.
原始YOLOv3模型被认为适合求解多尺寸的图像目标检测问题,但是对于粮虫小目标检测存在表征能力不足且检测效率较低的问题。本文基于此提出了一种融合GIoU算法的YOLOv3检测模型,一方面使用GIoU算法弥补IoU算法对于两个不相交box无法进行量化的问题,同时使用GIoU对损失函数进行优化,损失函数优化为GIoU损失、置信度损失和分类损失三方面;另一方面使用五种数据增强手段对原始1 998张数据集进行数据增强,最终形成大小为9 990张的数据集,并使用K-means聚类算法对自制数据集进行聚类分析,聚类出符合粮虫小目标检测的先验框。针对自制的9 990张粮虫的数据集进行实验获得了99.43%的mAP和每幅图像0.040 s的检测速度,与原始YOLOv3模型相比,本文所提模型对于小目标的粮虫检测效果得到了很大的提升。  相似文献   

15.
Chinese traditional costumes have been recognized as one of the most influential sources for Western designers to obtain oriental inspirations and create Asian chic, especially the dominant colors and design style. In this paper, an effective color clustering method based on Mean shift clustering algorithm is developed for Chinese traditional costumes image. The proposed method consists of four steps: (1) costumes image acquisition, (2) costumes image denoising, (3) object segmentation, and (4) color clustering and dominant colors extraction. Firstly, a digital SLR (Single Lens Reflex) camera is used to capture the costumes images. Secondly, the sub-images in the three color channels are filtered by median filter separately. Thirdly, the filtered images are segmented based on the background color in the Lab color space, and the object costumes is separated from the background. Fourthly, the pixels of the costume image are classified into several clusters by Mean shift clustering algorithm, and the dominate colors are extracted from the classification results. The experimental results demonstrate that the proposed method can extract the dominant colors from costumes images with great accuracy when the bandwidth of Mean shift clustering algorithm is set as 0.05.  相似文献   

16.
为进一步扩充谱聚类算法的研究空间,提出一种基于ε-邻域和拉普拉斯矩阵秩约束的谱聚类算法。利用ε-邻域对亲和矩阵进行稀疏处理,再对拉普拉斯矩阵加上秩约束;以l2,1范数为正则项参数来调整模型,使得模型学习到更合理的数据结构;利用交替迭代优化算法对模型求解。最后,在4个数据集上与其他几种聚类算法进行对比,验证结果表明了ε-RSC算法的有效性和可行性。  相似文献   

17.
BP神经网络是利用误差逆向传播训练的前馈网络,具有自适应、实时学习的特点,在分类中广泛应用。但当样本类别过多,BP神经网络的分类精度显著降低。基于此,本研究提出了一种K-means聚类算法和BP神经网络相结合的方法作稻米品种鉴别。利用图像处理方法提取出11种稻米样品的灰度平均值、长宽比和圆形度三项特征参数,利用K-means聚类算法对所得数据进行聚类,聚类的结果作为BP神经网络的输入,训练得到分类器。实验结果表明,这种算法的分类效果要优于单一使用BP神经网络和K-means算法,且分类准确率达到80%,可见本实验的方法用于稻米品种鉴别是可行的。  相似文献   

18.
基于电子鼻/舌融合技术的白酒类别辨识   总被引:1,自引:0,他引:1  
为实现白酒质量的快速鉴别,本研究采用两个不同的电子鼻和电子舌融合系统采集不同品牌白酒样品的气-味信息,采用主成分分析法、K均值法对检测结果进行聚类分析,采用支持向量机法对白酒的品牌进行预测分类分析。经主成分分析聚类分析后,应用基于TGS型气敏传感器的电子鼻和电子舌融合系统可以将3种酒进行很好的区分,其余5种酒有交叉,而应用基于MQ、MP型气敏传感器的电子鼻和电子舌融合系统可以将8种白酒基本区分开来;K均值法分别用于两融合系统,前融合系统的错分类概率为33.3%,后融合系统的错分类概率为23.75%。采用支持向量机法对白酒的品牌进行预测分类,应用前融合系统的识别率为93.75%,而应用后融合系统的识别率为98.75%。结果表明:气-味信息融合技术可以实现对白酒品牌的鉴别,且应用基于MQ、MP型气敏传感器的电子鼻和电子舌融合系统对白酒类别的识别结果较好于应用基于TGS型气敏传感器的电子鼻和电子舌融合系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号