首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
在基于高斯混合模型(GMM)的声纹识别算法中,K-means聚类算法是GMM模型参数初始化常用的方法之一。传统K-means算法在聚类过程中采用几何距离进行分类,忽略了类中各矢量的分布不同对聚类结果的影响,常常得不到令人满意的识别结果。文中对传统K-means算法进行了改进,并将改进后的K-means算法与GMM结合应用到声纹识别系统中。实验结果表明,改进的K-means算法与传统的算法相比具有更好的识别效果。  相似文献   

2.
3.
聚类分析是数据挖掘的最主要功能之一,其中CLIQUE算法是综合了基于密度和基于网格的聚类方法,对于大型数据库中的高维数据的聚类非常有效,解决了现有多种聚类算法只能处理低维空间数据的缺陷.通过分析研究聚类中的CLIQUE算法,将其应用于信用卡的审批模型中,能进行高效、智能的判断,为发卡银行提供有效的决策支持.  相似文献   

4.
针对传统的K-Means聚类算法对初始聚类中心依赖性较高,从而影响分类结果的问题,提出了一种改进算法,并将其应用于一家电器商场的客户群分中,为商场的营销活动提供了有价值的决策依据.  相似文献   

5.
CET-4是一个客观、准确的大学生英语能力测量平台,C4.5算法在应用于CET-4成绩分析中仍存在一些问题。针对运用C4.5算法对高职院校CET-4成绩数据构建分析决策树时存在的离散化运算繁琐、忽视各属性影响度等典型问题,提出一种面向高职院校CET-4成绩分析的改进C4.5算法。首先通过在C4.5算法中引入成绩正态分布规律确立初始聚类中心、K-means算法来离散连续属性;其次引入CET-4中听、读、写的权重来修正信息增益率的计算;最后运用改进的C4.5算法、经典的C4.5算法分别构建决策树模型并进行预测分析。实验结果表明,改进的C4.5算法所构建高职院校CET-4成绩分析的模型效率、预测能力均有明显提高。运用改进的C4.5算法有效地分析出影响CET-4达标各因素间的关系,从而提升CET-4反拨英语教学效应。  相似文献   

6.
在研究了基本蚁群聚类模型、信息熵以及几个经典的聚类分析算法的基础上,针对传统K—means算法的不足,首先提出了一种基于信息素的k-means改进算法,该算法以基于信息素的转移概率为判断标准来进行聚类,减少了算法的参数个数,加快了聚类的进程.在深入研究了基于信息熵的LF改进算法的基础上,提出了一种蚁群聚类组合算法策略.  相似文献   

7.
针对学术期刊运行与管理中对审稿专家缺乏准确评价依据的问题,结合评价分析的需求和K-means聚类算法特点,提出了一种基于改进的K-means聚类算法的审稿专家分类评价方法,该方法通过研究初始聚类中心的选择和评价标准的量化、聚类维度的选择和分类值大小的合理选择等问题,较为准确地解决了审稿专家的分类问题。经实例分析验证,该方法得到的结果是合理的,并具有很强的可操作性,为建立科学的审稿专家库和准确高质量地送审提供了科学的依据。  相似文献   

8.
本文针对传统的聚类算法在入侵检测系统中的不足,提出一种基于密度的初始聚类中心的选择方法,可克服普通K-Means中的需人工确定K值的问题,用此算法改进的入侵检测模型能够获得很好的聚类效果。对比实验结果,发现使用改进后的算法与传统的K-Means相比可以获得更高的检测率和较低的误报率。  相似文献   

9.
从数据挖掘的基本技术着手,分析了K-means聚类算法、基于相似度的聚类算法和蚁群聚类算法的特点,探讨了3种聚类算法在入侵检测系统中的应用步骤、计算方法,并通过实验测试,验证了3种算法对未知入侵行为检测的可行性。  相似文献   

10.
数据挖掘是近年来数据库领域的研究热点之一,在电力系统中有很好的应用前景.文章首先分析了当前Apriori算法及主要的改进算法,在此基础上提出了一种快速产生候选频繁项集的新的Apriori改进算法,并就Apriori算法在电力系统数据挖掘中的应用进行了分析.  相似文献   

11.
基于K-means聚类算法的分析及应用   总被引:7,自引:0,他引:7  
聚类分析能作为一个独立的工具来获得数据分布的情况,观察每一个簇的特点,集中对特定的某些簇作进一步的分析;本文主要介绍了传统聚类算法及其局限性,然后对直接K-means算法进行分析改进,着重分析了该算法的思想体系以及它的优缺点,针对它的缺点之一提出了一种基于距离的改进策略,并将该改进策略应用到对学生成绩的分析中,实验目的是应用该算法将学生划分为合理的簇(或类)以及对聚类结果进行分析,总之实验表明了该算法的灵活性以及在此应用中的适用性.  相似文献   

12.
针对全局K-均值算法时间复杂度大的问题,提出一种增量选择初始聚类中心的新方法。选择数据集中周围分布最密集的样本作为第一个初始聚类中心,选择最小化目标函数贡献大,并且和已有聚类中心距离远的样本作为下一个初始聚类中心。改进算法减少了增量选取初始聚类中心时的计算量,降低了时间复杂度。实验证明,改进算法与全局K-均值算法、快速全局K-均值算法相比,在不影响聚类效果的基础上,减少了聚类时间,与优化初始聚类中心的算法相比,聚类效果更优。  相似文献   

13.
针对保险业对客户信息的分析中缺乏考虑客户信用分析的问题,根据聚类分析算法理论和保险公司客户数据库特点,进一步对K-means聚类算法在大样本环境下初始聚类中心的选取提出有效改进,同时选取一家财产保险公司的客户信用数据,来探讨聚类算法在保险客户信用分析中的应用.  相似文献   

14.
移动互联网时代,网络信息的优化处理需求突出。论述了酒店信息特点及其预处理方法。在正常状态以及屏幕滑动2种情况下,构建了基于改进的 K-means酒店信息聚类算法。实验结果表明,改进的K-means聚类算法能够优化移动平台下酒店预订信息处理过程,其数据运算效率和用户体验有显著提升。  相似文献   

15.
针对日益严峻的大数据处理时间长、执行速率低等问题,通过深入分析,提出了一种提高大规模数据聚类效率的方法。以K-均值聚类算法为原型,利用Map Reduce模型在大规模数据处理方面的优势,对原有算法进行并行化改进,设计出一种基于Hadoop分布式云平台的K-均值聚类Map Reduce模型。应用此模型,对淘宝用户仿真数据进行聚类试验,试验结果表明,对K-均值聚类算法的Map Reduce模型实现后,性能优于原算法性能,缩短了聚类时间,提高了聚类效率,特别适于对海量数据进行聚类处理。  相似文献   

16.
传统的K-means算法是一种常用的聚类算法,但它对于初始聚类中心敏感,容易受到"噪声"和孤立点的影响,由此提出了一种基于网格的二次K-means聚类算法.此算法先将空间划分为多个大小相等的网格,然后根据给定的密度阈值来计算出密集网格,对密集网格中的点进行初次聚类,将初次聚类结果的均值点作为第二次聚类的初始均值点,从而消除了"噪声"和孤立点的影响,并且保证了信息的完整,实验证明此算法是有效的.  相似文献   

17.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

18.
Anomaly detection and recognition are of prime importance in process industries. Faults are usually rare, and, therefore, predicting them is difficult. In this paper, a new greedy initialization method for the K-means algorithm is proposed to improve traditional K-means clustering techniques. The new initialization method tries to choose suitable initial points, which are well separated and have the potential to form high-quality clusters. Based on the clustering result of historical disqualification product data in manufacturing process which generated by the Improved-K-means algorithm, a prediction model which is used to detect and recognize the abnormal trend of the quality problems is constructed. This simple and robust alarm-system architecture for predicting incoming faults realizes the transition of quality problems from diagnosis afterward to prevention beforehand indeed. In the end, the alarm model was applied for prediction and avoidance of gear-wheel assembly faults at a gear-plant.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号