首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

2.
现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.  相似文献   

3.
为改善近邻传播聚类算法对高维数据的聚类效果,引入马氏距离替换原算法中的欧氏距离,并借助正则化总散度矩阵的奇异值分解实现数据变换预处理,进而在在降维后的变换子空间中对数据集进行聚类。针对Iris、User、Soybean和Vehicle四个数据集,选取适当正则化参数,经仿真实验可见,改进算法的聚类精度在整体上有所提高。  相似文献   

4.
针对一类非线性系统的控制问题,结合基于仿射传播聚类的最小二乘支持向量机(LS-SVM)多模型建模算法与PSO优化算法,提出新的多模型预测控制算法.采用仿射传播聚类算法对历史样本数据进行聚类,得到各个类的训练样本数据|利用LS-SVM对各个类分别建立子模型,采用网格搜索和交叉验证为各子模型找到合适的模型参数,将所建立的子模型作为预测控制算法的预测模型.在滚动优化时,计算当前控制量与各聚类中心的欧氏距离,选择相应的子模型计算未来时刻模型的预测输出,计算得到参考轨迹.建立优化问题的目标函数,采用PSO算法优化求解得到系统的最优控制量作用于对象.将提出的算法在某芳烃异构化过程中进行仿真试验,分别采用提出的算法以及单模型预测控制算法、基于k均值和BP神经网络的多模型预测控制算法进行仿真.结果表明,采用提出的多模型预测控制算法可以获得更好的控制性能.  相似文献   

5.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

6.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

7.
采用属性聚类的高维子空间聚类算法   总被引:4,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

8.
为了解决现有子空间聚类算法时间复杂度偏高和对输入参数敏感的问题,提出了一种基于联合熵矩阵的子空间聚类算法. 通过计算每个属性实例分布的熵降维,计算任意两个维度的联合熵,形成联合熵矩阵,在联合熵矩阵中搜索最高阶全1子矩阵作为兴趣子空间,最后在兴趣子空间完成聚类. 在人工数据集和公开数据集上的实验表明,与传统子空间聚类算法相比,新算法能以较低的开销识别维度更高的兴趣度子空间.  相似文献   

9.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

10.
在聚类过程中结合簇内紧凑度信息和特征权值分布信息,对数据集的划分和各个簇类所在的子空间两方面进行优化。实验结果表明,该算法相比已有的软子空间聚类算法具有更好的聚类效果。  相似文献   

11.
With the rapid development of WLAN (Wireless Local Area Network) technology, an important target of indoor positioning systems is to improve the positioning accuracy while reducing the online computation. In this paper, it proposes a novel fingerprint positioning algorithm known as semi-supervised affinity propagation clustering based on distance function constraints. We show that by employing affinity propagation techniques, it is able to use a fractional labeled data to adjust similarity matrix of signal space to cluster reference points with high accuracy. The semi-supervised APC uses a combination of machine learning, clustering analysis and fingerprinting algorithm. By collecting data and testing our algorithm in a realistic indoor WLAN environment, the experimental results indicate that the proposed algorithm can improve positioning accuracy while reduce the online localization computation, as compared with the widely used K nearest neighbor and maximum likelihood estimation algorithms.  相似文献   

12.
近邻传播聚类算法(affinity propagation, AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi supervised clustering algorithm based on affinity propagation, 2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation, SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。  相似文献   

13.
在数据聚类的过程中,由于样本数据空间分布的复杂性,相似度度量过程中的重复性以及算法的自适应性等问题,聚类算法往往无法得到正确的聚类结果.为了解决样本数据空间分布复杂的问题,提出叠加信息熵数据游走聚类算法.该算法通过在数值空间构建样本叠加信息熵场,并通过数据游走进行数据分割实现聚类.实验结果表明,该算法不仅可以获得较好的聚类效果,同时具有较高的数据自适应性.  相似文献   

14.
基于GraphLab的分布式近邻传播聚类算法   总被引:1,自引:1,他引:0  
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法--GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用“Gather-Apply-Scatter”的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。  相似文献   

15.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

16.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号