期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

韩琮师李旭健《软件》2020,(3):21-23

随着互联网时代的到来,每天都有大量的历史数据堆积,这些数据含有巨大的价值,然而由于没有合适的分析方法,它们并没有被充分的利用;传统的K-means算法具有复杂度低,计算速度快,对硬件要求低等特点,使其在聚类分析中被广泛使用,但是传统的K-means算法受初始聚类中心选择的影响而导致数据聚类结果不准确;本文基于传统的K-means算法,首先在选取初始聚类中心前,通过PSO方法对初始聚类中心进行优化,然后选取初始聚类中心,接着用权重法优化样本之间的距离,最后运用改进后的K-means算法对某电商平台中的巧克力商品进行聚类实验。实验结果表明,在聚类数目相同的前提下,改进后的算法比传统的K-means算法在准确性上有较大的提高。相似文献

2.

基于改进的K-means算法的关联规则数据挖掘研究

李珺刘鹤朱良宽《小型微型计算机系统》2021,(1):15-19

关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率. 相似文献

3.

一种改进的K-means聚类算法 总被引：1，自引：0，他引：1

张建民《微计算机信息》2010,(9)

本文提出了一种带离群点数据过滤的K-means改进算法。该算法根据离群点数据特征制定了离群点数据的发现规则,并在原算法中加入了离群点数据的发现和处理步骤。通过对给定的具有普遍意义的数据实验表明,改进后算法能较为稳定的发现数据集中存在的离群点数据,这些离群点数据符合离群点数据特征;同时在剔除这些极少数离群点数据后,显著提高了聚类结果簇的凝聚度,从而有效克服了离群点数据对K-means算法的影响,使聚类效果得以显著提高。相似文献

4.

基于改进K-means算法的微博舆情分析研究

谢修娟李香菊莫凌飞《计算机工程与科学》2018,40(1):155-158

为避免初始聚类中心选取到孤立点容易导致聚类结果陷入局部最优的不足,提出一种基于密度的K-means(聚类算法)初始聚类中心选择方法。该方法首先计算每个数据对象与其它数据对象间的平均相似度,找出平均相似度高于某固定阈值的对象视作核心对象,再从核心对象中选取彼此间最不相似的作为初始聚类中心。通过自构建的新浪微博抓取工具,分别抓取不同类别的数千条数据,经过分词、预处理及权重计算后,用改进的K-means算法对其进行聚类分析,查准/全率较传统的K-means算法要稳定,聚类的平均时间也得到缩短。实验结果表明,改进后的算法在微博聚类中有更高的准确性和稳定性,有利于从大量的微博数据中发现热点舆情。相似文献

5.

基于企业应用的K-means算法的实现与改进

罗俊《数字社区&智能家居》2021,(18):29-31

K-Means算法,也称为K-均值,是数据挖掘研究中是一种最基本的算法,也是应用最广泛的聚类算法。在电子商务、入侵检测、CRM等领域有较多的应用实例。它是一种cluster analysis的算法,其实现主要通过不断循环迭代地选取离种子点最近均值的过程。本文结合企业实际应用阐述k-means的实现过程、具体的改进思路以及应用价值,聚类模型的建立对企业具有较强的实际意义。相似文献

6.

融入改进的K-means聚类的协同过滤算法的研究与应用

《软件》2021,42(3)

相似文献

7.

基于K-means优化的SOM神经网络算法的视频推荐系统

付丽梅《软件工程》2022,(10):17-19+7

为解决视频推荐系统中推荐精度不够精准的问题,提出一种K-means优化的自组织映射(Self-organizing Map,SOM)神经网络视频推荐方法。首先,爬取视频网站的数据并对其进行处理;其次,将处理后的数据输入K-means算法优化的SOM神经网络中,得到聚类结果;最后通过计算归类视频的弹幕数量、点击量、评分等推荐出优秀的视频。文中系统的预期结果为在主界面选择分类并输入关键词之后,通过算法计算,为用户推荐感兴趣的视频,并按评分高低列出视频的超链接。实验结果表明,优化的SOM算法在视频推荐的精度上提升了5%—8%。相似文献

8.

基于百度地图的改进的K-means算法研究

《软件》2016,(1):76-80

聚类分析在科研和商业应用中都有着非常重要的应用,K-means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-means算法的局限性日益突出。在百度地图的各种坐标体系下,提出一种改进的基于网格的K-means算法,用新的方法确定k值以及K个初始质心。相对于传统的K-means算法,该算法在一定程度上减少了因采用误差平方和准则函数而出现较大的聚类簇分割开的情况,仿真实验结果表明:改进后的K-means算法优于原始算法,并且稳定性更好。相似文献

9.

基于改进K-means算法的图像分割

李恒博刘静超吴珂彤《现代计算机》2024,(2):49-51+91

图像分割在图像分析的整个流程中占据关键地位,是图像理解中的重要步骤,同时,它也被看作是图像处理领域最有挑战性的难题之一。因此该研究提出一个基于改进K-means算法的图像分割方法。对图片进行等切选取初始簇心,设定阈值合并多余的簇,给定平均直径优化簇心数量及分类效果。通过实验,验证了该方法的有效性。相似文献

10.

基于MapReduce框架下K-means的改进算法

阴爱英吴运兵朱敏琛张莹《计算机应用研究》2018,35(8)

针对海量数据背景下K-means聚类结果不稳定和收敛速度较慢的问题,提出了基于MapReduce框架下的K-means改进算法。首先,为了能获得K-means聚类的初始簇数,利用凝聚层次聚类法对数据集进行聚类,并用轮廓系数对聚类结果进行初步评价,将获得数据集的簇数作为K-means算法的初始簇中心进行聚类;其次,为了能适应于海量数据的聚类挖掘,将改进的K-means算法部署在MapReduce框架上进行运算。实验结果表明,在单机性能上,该方法具有较高的准确率和召回率,同时也具有较强的聚类稳定性;在集群性能上,也具有较好的加速比和运行速度。相似文献

11.

基于K-means算法改进的SOM神经网络调制识别分类器

冯利利王华奎韩应征贾若思《电脑开发与应用》2011,24(1):8-10

通信过程中,获得情报信息的关键步骤是清楚接收到的调制信号的调制方式.随着现代通信技术的高速发展,人工智能广泛应用于调制方式识别领域.提出将自组织特征映射(Self-Organizing feature Map,简称SOM网络)神经网络用于调制制式的识别.用K均值(K-means)聚类算法来寻找每类特征参数的两个聚类中心... 相似文献

12.

基于K-means算法的飞机下降过程油耗分类

陈静杰李吕琪《测控技术》2015,34(11):16-19

飞机下降过程受飞行环境和流量影响而运行情况复杂,相应油耗也不同.提出一种基于下降段实飞距离、平均下降率、下降点标准高度等多种飞行特征指标的下降过程分类方法.该方法先对QAR数据进行统计分析,找出影响下降过程油耗的飞行特征指标,应用Pearson相关系数进行油耗特征选择,进而应用K-means算法针对相关性大的指标进行油耗聚类.结果将油耗分为明显的两类,可看出两类的飞行特征差异,这为进一步设计节油下降轨迹提供了新视角. 相似文献

13.

基于环形数据集的改进K-means聚类算法

《软件》2021,42(11)

相似文献

14.

改进K-means算法在入侵检测中的应用研究

王茜刘胜会《计算机工程与应用》2015,51(17):124-127

为了弥补传统K-means聚类算法在K值确定和初始中心选择难等方面的不足,基于“合并与分裂”思想,提出一种改进的K-means聚类算法。将数据独立程度概念引入实验数据子集构造理论中,利用独立程度评价属性的重要性;根据点密度将数据集合并为若干类,结合最小支撑树聚类算法与传统K-means聚类算法实现分裂;使用KDD Cup99数据集对改进算法在入侵检测中的应用进行仿真实验。结果表明,改进算法在检测率和误报率方面均优于传统K-means算法。相似文献

15.

一种改进的K-means入侵检测算法

张珂嘉黄树成《计算机与数字工程》2021,49(10):1963-1966,2047

传统的K-means算法存在初始质心敏感、需要人为指定K个数等问题,可以通过融合Canopy算法在一定程度上缓解,但是仍然存在抗噪能力弱、质心选择盲目、运算时间长等问题.论文提出了一种改进算法,在抗噪性、初始质心选择、运算过程三方面,对Canopy-K-means算法进行优化.该算法采用了剪枝、最大最小规则、相似度计算等策略来实现算法目标.实验数据表明,改进后的Canopy-K-means算法对比传统的Canopy-K-means算法、K-means算法均具有更高的检测率、更低的误报率. 相似文献

16.

基于改进BIRCH聚类算法的评价对象挖掘

《软件》2019,(11)

本文对于意见挖掘领域中的评价对象的修剪和聚类问题,提出使用K-means聚类算法和BIRCH聚类算法相结合的方式来进行评价对象的修剪和聚类。利用BIRCH算法类别聚类的功能对评价对象进行聚类,并删除包含较少数据的簇来实现修剪评价对象;再通过对于剩下的簇使用K-means聚类算法来获得最优评价对象。这种修剪聚类方法与以往的基于PMI算法修剪然后基于K-means聚类算法相比,减少了评价对象修剪时对语料库的依赖,最终聚类的结果更加精准,而且BIRCH算法采用一次扫描数据库的策略,可以有效提高速度。相似文献

17.

一种基于K-means改进的社区发现算法

欧璇于建军《数据与计算发展前沿》2017,8(5):11-18

传统的社区发现算法往往时间复杂度较高,K-means算法作为聚类算法且时间复杂度较低可为社区发现提供新思路,但K-means算法的原始应用场景为数值环境与社交网络不符,且自身存在初始中心节点选取敏感等原有问题,针对上述问题本文在下面三个方面进行了优化：第一,结合最短路径及共同邻居信息重新定义距离度量;第二,结合了节点的度和节点距离因素进行初始中心节点选取;第三,在K-means算法结果的基础上进行基于贪心策略以模块度为目标的层次聚类优化。通过实验表明：改进的K-means算法能够很好地应用于社区发现,得到的社区发现结果有较高质量。相似文献

18.

基于极限学习机与改进K-means算法的入侵检测方法

王琳琳刘敬浩付晓梅《计算机工程与科学》2018,40(8):1398-1404

入侵检测系统对于保障网络安全至关重要。针对传统的单一检测算法很难对不同种类的攻击都有很好检测效果的问题,提出一种结合极限学习机与改进K means算法的入侵检测方法。基于算法级联的方式,利用新型线性修正单元（PReLU）激活函数对极限学习机算法进行优化,采用设置距离阈值的方式,实现K means算法自动选择初始聚类中心与聚类簇数目的双重优化,设计了一种混合式入侵检测方法。采用NSL KDD数据集对所提出的入侵检测方法进行仿真实验,实验结果表明,与传统的BP神经网络、支持向量机与极限学习机算法相比,该方法有效地提高了检测效果,同时降低了误报率。相似文献

19.

基于K-means算法的企业信用无监督分类研究

施天虎韦诗玥《数字社区&智能家居》2021,(22):144-145

企业信用分类的应用,能够为商业银行降低信贷业务的风险,随着市场竞争的不断加剧,机器学习和大数据的应用,越来越多的计量方法不断革新,并广泛运用到信用分析领域。本文设计了一个基于K-means算法的企业信用无监督分类方法,通过对企业信息进行大数据分析,提取企业信用相关的内容,再使用K-means算法对企业数据进行聚类,对目标企业根据其聚类所在簇来评估信用等级,以此对企业的信用进行分类。相似文献

20.

基于聚类准则函数的改进K-means算法

张雪凤张桂珍刘鹏《计算机工程与应用》2011,47(11):123-127

K-means算法所使用的聚类准则函数是将数据集中各个簇的误差平方值直接相加而得到的;不能有效处理簇的密度不均且大小差异较大的数据集。为此;将K-means算法的聚类准则函数定义为加权的簇内标准差之和;权重为簇内数据对象数占总数目的比例。同时;调整了传统K-means算法将数据对象重新分配给簇的方法;采用一个数据对象到中心点的加权距离代替传统K-means算法中的距离;将数据对象分配给使加权距离最小的中心点所在的簇。实验结果表明;针对模拟数据集的聚类;改进K-means算法可以明显减少大而稀的簇中数据对象被错误地分配到相邻的小而密簇的可能性;改善了聚类的质量;针对UCI数据集的聚类;改进算法使得各个簇更为紧凑;从而验证了改进K-means算法的有效性。
相似文献