首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对传统鲁棒高斯混合模型EM算法存在模型成分参数难以精确获取最优解以及收敛速度随样本数量的增加而快速降低等问题,提出了一种基于鲁棒高斯混合模型的加速EM算法。该算法采用隐含参量信息熵原理对高斯模型分量个数进行挑选以及使用Aitken加速方法减少算法的迭代次数,当接近最优解时,EM步长的变化极为缓慢,这时使用Broyden对称秩1校正公式进行校正,使算法快速收敛,从而能够在很少的迭代次数内精确获取高斯混合模型的模型成分数。文中算法通过与传统鲁棒EM算法和无监督的EM算法的聚类结果进行比较,实验证明该算法对初始值的设定并不敏感(成分数c无需预先设定),并且能够降低算法运算时间,提高聚类模型成分数(类簇)的正确率。  相似文献   

2.
发掘并掌握站内乘客群体的聚集时空变化规律,对于优化城市轨道交通线网间车辆的调度,特别是优化灾害条件下的客流组织管理等,具有积极的作用.针对具有密度分布非均匀特征的车站乘客位置数据集,提出一种基于高斯混合模型的DBSCAN聚类算法.首先,利用高斯混合模型对数据集进行密度的分层处理;然后,面向不同密度层次的数据集进行局部聚类,确定各密度层数据集的参数,并选取恰当的种子以完成局部聚类簇扩展;最后,将各密度层次数据集的聚类结果进行合并.通过标准和实测数据的计算结果表明,基于高斯混合模型优化后的DBSCAN算法,对于非均匀密度分布的乘客位置分布数据具有更好的聚类效果.  相似文献   

3.

针对粗糙模糊聚类算法对初值敏感、易陷入局部最优和聚类性能依赖阈值选择等问题, 提出一种混合蛙跳与阴影集优化的粗糙模糊聚类算法(SFLA-SRFCM). 通过设置自适应调节因子, 以增加混合蛙跳算法的局部搜索能力; 利用类簇上、下近似集的模糊类内紧密度和模糊类间分离度构造新的适应度函数; 采用阴影集自适应获取类簇阈值. 实验结果表明, SFLA-SRFCM 算法是有效的, 并且具有更好的聚类精度和有效性指标.

  相似文献   

4.
针对聚类问题中的非随机性缺失数据, 本文基于高斯混合聚类模型, 分析了删失型数据期望最大化算法的有效性, 并揭示了删失数据似然函数对模型算法的作用机制. 从赤池弘次信息准则、信息散度等指标, 比较了所提出方法与标准的期望最大化算法的优劣性. 通过删失数据划分及指示变量, 推导了聚类模型参数后验概率及似然函数, 调整了参数截尾正态函数的一阶和二阶估计量. 并根据估计算法的有效性理论, 通过关于得分向量期望的方程得出算法估计的最优参数. 对于同一删失数据集, 所提出的聚类算法对数据聚类中心估计更精准. 实验结果证实了所提出算法在高斯混合聚类的性能上优于标准的随机性缺失数据期望最大化算法.  相似文献   

5.
针对无线传感网随规模的扩大其节点能量利用率较低的问题,提出了一种适用于大规模无线传感网的基于CFSFDP和泊松混合模型的分簇路由算法(CRCPMM).其核心思想是:在基站利用改进的CFSFDP算法自动估计簇的数目K值并选取聚类中心,然后运用泊松混合模型将节点合理聚类,以保证聚类效果最优;簇间采用多跳传输方式,综合考虑簇首等效剩余能量、簇首之间的距离以及多跳路径与理想最优路径之间的角度.仿真结果表明:与低功耗自适应集簇(LEACH)协议、分布式能量有效非均匀成簇(DEBUC)协议相比,CRCPMM协议在大规模网络中具有明显的优势,能够有效均衡节点能耗,延长网络生命周期.  相似文献   

6.
针对传统差分隐私保护的谱聚类算法存在聚类效果不理想的不足,提出一种面向差分隐私保护的自适应谱聚类优化新算法。采用互邻高斯核函数得到稀疏相似度矩阵,分析高维数据集的数据特征与聚类簇数的关系解决降维幅度和聚类簇数的不确定性;引入中间信息向量和中间性的概念来克服初始簇中心选取的盲目性;根据多维高斯分布离群点检验后的结果采用插补法解决离群点问题。仿真实验结果表明,该算法能够有效克服传统方法的不足,且在同一数据集相同隐私保护参数下,可以在保证数据隐私安全性的同时改善聚类效率并显著提高聚类可用性。  相似文献   

7.
为了更好地评价无监督聚类算法的聚类质量,解决因簇中心重叠而导致的聚类评价结果失效等问题,对常用聚类评价指标进行了分析,提出一个新的内部评价指标,将簇间邻近边界点的最小距离平方和与簇内样本个数的乘积作为整个样本集的分离度,平衡了簇间分离度与簇内紧致度的关系;提出一种新的密度计算方法,将样本集与各样本的平均距离比值较大的对象作为高密度点,使用最大乘积法选取相对分散且具有较高密度的数据对象作为初始聚类中心,增强了K-medoids算法初始中心点的代表性和算法的稳定性,在此基础上,结合新提出的内部评价指标设计了聚类质量评价模型,在UCI和KDD CUP 99数据集上的实验结果表明,新模型能够对无先验知识样本进行有效聚类和合理评价,能够给出最优聚类数目或最优聚类范围.  相似文献   

8.
自适应仿射传播聚类   总被引:42,自引:4,他引:42  
王开军  张军英  李丹  张新娜  郭涛 《自动化学报》2007,33(12):1242-1246
适合处理大类数的仿射传播聚类有两个尚未解决的问题: 一是很难确定偏向参数取何值能够使算法产生最优的聚类结果; 另一个是当震荡发生后算法不能自动消除震荡并收敛. 为了解决这两个问题, 提出了自适应仿射传播聚类方法, 具体技术包括: 自适应扫描偏向参数空间来搜索聚类个数空间以寻找最优聚类结果、自适应调整阻尼因子来消除震荡以及当调整阻尼因子方法失效时的自适应逃离震荡技术. 与原算法相比, 自适应仿射传播聚类方法性能更优, 能够自动消除震荡和寻找最优聚类结果. 对模拟和真实数据集的实验结果表明, 自适应仿射传播聚类方法十分有效, 其聚类质量优于或不低于原算法.  相似文献   

9.
pSCAN算法的聚类结果受密度约束参数和相似度阈值参数的影响,如果用户提供的聚类参数得到的聚类结果无法满足需求,那么用户可以通过实例簇表达自己的聚类需求。针对实例簇表达聚类查询需求的问题,提出一种实例簇驱动的图结构聚类参数计算算法PART及其改进算法ImPART。首先,分析两个聚类参数对聚类结果的影响,并提取实例簇的相关子图;其次,对相关子图进行分析得到密度约束参数的可行区间,并根据当前密度约束参数和节点之间的结构相似度将实例簇内节点划分为核心节点和非核心节点;最后,依据节点划分结果计算出当前密度约束参数对应的最优相似度阈值参数,并在相关子图上对得到的参数进行验证和优化,直到得到满足实例簇需求的聚类参数。在真实数据集上的实验结果表明,所提算法能够为用户实例簇返回一组有效参数,且所提改进算法ImPART的运行时间比PART缩短了20%以上,能够快速有效地为用户返回满足实例簇要求的最优聚类参数。  相似文献   

10.
已有的矢量聚类算法需学习较多的复杂数据方可获得较好的聚类效果,而对于多维的大数据性能较弱,对此,提出一种基于量化误差与分形理论的高计算效率无监督聚类算法。首先,为数据集建立量化误差的参数化模型,基于数据集的空间结构获得数据集的率失真曲线;然后,通过对率失真曲线的估算,获得数据空间的有效维度;最终,利用分形理论,通过搜索数据集的量化模型参数获得目标数据集的最优类簇数量。实验结果表明,本文的量化误差参数化模型可较好地估算数据集的有效维度,同时,本算法对数值型数据集的最优类簇估算与计算效率优于已有的矢量聚类算法。  相似文献   

11.
针对K-means聚类算法存在初始聚类中心影响聚类精度的问题,提出采用生物地理学算法优化K-means聚类中心,使其能提高聚类算法的准确率。在基准数据集中对本算法进行实验,其结果表明改进算法具有良好的性能。其次,采用改进的K-means聚类算法对不同工况下的锅炉燃烧工艺参数进行聚类,并挖掘出每一类中热效率最高时的燃烧工艺参数作为最佳工艺参数,使锅炉在最佳工艺参数下进行燃烧,达到提高热效率的目的。为了验证最佳工艺参数的有效性,采用贝叶斯最小二乘支持向量机辨识锅炉热效率模型,结果显示热效率明显提高,说明经过优化型K-means聚类算法挖掘的最佳工艺参数是有效的。  相似文献   

12.
针对圆投影模板匹配方法特征提取过程中损失大量图像信息的缺点,提出了结合聚类模型参数的线性光照鲁棒圆投影模板匹配方法。所提方法采用线性对比度拉伸来消除光照影响,并将模板图像各圆环内像素点的高斯混合模型聚类参数作为模板特征。匹配时通过一次迭代计算即可得到匹配误差,且该匹配过程可通过查找表来提高匹配速度。在目标搜索时使用了降采样搜索方法,并将降采样搜索匹配后各位置的误差均值作为自适应阈值,对匹配误差小于该阈值的降采样点邻域进行逐点匹配,匹配误差最小的位置作为最终匹配结果。试验及分析说明所提方法的定位误差及可靠度与基于归一化相关及均值的圆投影匹配算法相比有较大提高。  相似文献   

13.
为提高遥感图像分割的准确性与抗噪性,以学生t分布混合模型为基础,结合K-means与花粉算法的特点,将K-means算法局部寻优能力强以及花粉算法全局寻优能力强的优点相结合,提出一种基于K-means的学生t分布混合模型,用于遥感图像分割。该方法中,根据学生t分布与高斯分布以及柯西分布比较接近的特点,对花粉算法的执行过程进行改进。将K-means算法与改进后的花粉算法结合以提高聚类效果,从而快速确定混合模型参数初始值。混合模型最终参数的求解主要采用EM算法,以提高算法最终的图像分割效果。仿真图像和实际图像实验结果显示,该研究得到了比对比方法分割精度更高、稳定性更好的分割结果。  相似文献   

14.
针对在线K-均值聚类法初始化混合高斯模型(KGMM)在运行时间、空间复杂度、噪声等方面存在的缺陷,提出了基于KGMM改进的检测方法,采用加入方差因子的C-均值聚类准则来初始化混合高斯模型,有效解决了可能出现的某一像素值属于不同分布类从而概率不同的问题,提高了检测的灵活性;改进了高斯匹配准则,提高了检测算法的准确性;对每个像素点间隔地建立混合高斯分布,减少了高斯模型个数,节省了存储空间,提高了算法的运行速度。实验结果表明改进的检测算法检测效果更理想。  相似文献   

15.
遗传K-均值初始化的t混合模型医学图像聚类*   总被引:1,自引:1,他引:0  
针对基于混合模型的图像聚类质量易受混合模型参数初始值的影响,提出一种遗传K-均值初始化的t混合模型医学图像聚类方法。该方法构建一种医学图像的t混合模型,将遗传算法与K-均值算法相结合,实现对医学图像的初始划分,从而获得混合模型的初始参数,有效克服混合模型对参数初始值选择的敏感性问题,用EM算法多次迭代估计t混合模型参数;最后根据得到的混合模型对医学图像进行聚类。实验表明,该方法实现了医学图像较精准的聚类,有较好的稳定性和通用性。  相似文献   

16.
基于自适应权重的粗糙K均值聚类算法   总被引:2,自引:0,他引:2  
原有Rough K-means算法中类的上、下近似采用固定经验权重,其科学性值得商榷,针对这一问题,设计了一种基于自适应权重的粗糙K均值聚类算法。基于自适应权重的粗糙聚类算法在每一次迭代过程中,根据当前的数据划分状态,动态计算每个样本对于类的权重,降低了原有算法对初始权重的依赖。此外,该算法采用近似集合中的高斯距离比例来表现样本权重,从而可以在多种数据分布上得到更精确的聚类结果。实验结果表明,基于自适应权重的粗糙K均值算法是一种较优的聚类算法。  相似文献   

17.
针对差分隐私保护下单一聚类算法准确性和安全性不足的问题,提出了一种基于差分隐私保护的Stacking集成聚类算法。使用Stacking集成多种异质聚类算法,将K-means聚类、Birch层次聚类、谱聚类和混合高斯聚类作为初级聚类算法,结合轮廓系数对初级聚类算法产生的聚类结果加权并入原始数据,将K-means算法作为次级聚类算法对扩展后的数据集进行聚类分析。其中,针对原始数据和初级聚类算法的聚类结果分别提出自适应的ε函数确定隐私预算,为不同敏感度的数据分配不同程度的Laplace噪声。理论分析和实验结果均表明,与单一聚类算法相比,该算法满足ε-差分隐私保护的同时有效提高了聚类准确性,实现了隐私保护与数据可用性的高度平衡。  相似文献   

18.
窃电等异常用电行为严重影响着电网系统的安全、可靠和稳定运行,传统异常用电检测方法存在模型复杂、准确率低等问题。提出了一种基于特征选择和改进K-均值聚类的异常用电检测算法,首先从用电量变化、线路损耗和电力参数三个维度提取15维特征构成特征向量,然后利用相关向量机(Relevance Vector Machine, RVM)进行特征选择,自动确定最优特征集合,最后提出一种基于信息增益的改进K-均值聚类算法对最优特征集合进行聚类分析,从而实现异常用电检测。基于爱尔兰智能电表公开数据集开展实验,结果表明,所提方法在精准率、召回率和ROC曲线AUC值三项指标方面均能获得良好的表现性能,明显优于传统方法。  相似文献   

19.
徐沁  罗斌 《计算机工程》2013,(12):204-210
针对初始点选择不当导致K—means陷入局部最小值问题,提出一种结合自适应mean-shift与最小生成树(MST)的K—means聚类算法。将数据对象投影到主成分分析(PCA)子空间,给出自适应mean.shift算法,并在PCA子空间内将数据向密度大的区域聚集,再利用MST与图连通分量算法,找出数据的类别数和类标签,据此计算原始空间的密度峰值,并将其作为K.means聚类的初始中心点。对K—means的目标函数、聚类精度和运行时间进行比较,结果表明,该算法在较短的运行时间内能给出较优的全局解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号