共查询到20条相似文献,搜索用时 62 毫秒
1.
针对传统EM算法存在初始模型成分数目需要预先指定以及收敛速度随样本数目的增长而急剧减慢等问题,提出了一种快速、贪心的高斯混合模型EM算法。该算法采用贪心的策略以及对隐含参数设置适当阈值的方法,使算法能够快速收敛,从而在很少的迭代次数内获取高斯混合模型的模型成分数。该算法通过与传统EM算法、无监督EM算法和鲁棒EM算法的聚类结果进行比较,实验结果证明该算法具有很强的鲁棒性,并且能够提高算法的效率以及模型成分数的准确性。 相似文献
2.
3.
基于有限混合多变量t分布的鲁棒聚类算法 总被引:1,自引:1,他引:0
在用混合模型聚类时,聚类数据中存在局外点是非常困难的问题。为了提高混合拟合的鲁棒性,本文用混合t模型替代混合高斯模型,来拟合含有背景噪音的多变量多高斯分布数据;提出了两个求解混合t模型的修改版期望最大化(EM)算法,并将它们与模型选择准则集成在一起,应用一个组合规则成分灭绝策略选择聚类成分数,得到两个对应的鲁棒聚类算法。对含有背景噪音的多个高斯成分进行不同聚类算法的大量实验表明,本文的鲁棒聚类算法能自动选择最佳的聚类成分数,相对于混合高斯模型的聚类方法,鲁棒性增强很多;相对于传统求解混合t模型(EM/ECM)的聚类方法,能有效避免其严重依赖初始值和易收敛至参数空间边界的缺点,具有较强的鲁棒性和较快的收敛速度。 相似文献
4.
高斯混合模型聚类中EM算法及初始化的研究 总被引:6,自引:0,他引:6
EM算法是参数估计的重要方法,其算法核心是根据已有的数据来迭代计算似然函数,使之收敛于某个最优值。EM算法收敛的优劣很大程度上取决于其初始参数。运用EM算法来实现高斯混合模型聚类,如何初始化EM参数便成为一个关键的问题。在比较其他的初始化方法的基础上,引入“binning”法来初始化EM。实验结果表明,应用binning法来初始化EM的高斯混合模型聚类优于其它传统的初始化方法。 相似文献
5.
杨永国 《计算机测量与控制》2021,29(6):46-50
为了最大化的找出软件测试用例集中的相似用例,实现对用例的最优精简,提出了一种自适应的高斯混合模型;提出的模型使用K-means初始化EM,自适应地确定聚类簇数目,在此过程中能够评判聚类结果,同时给出式高斯混合模型的所有参数,这些参数作为各个聚类簇进行新一轮迭代计算的参数,最终得到的结果更趋于最优解;实验结果表明,相对现有的高斯混合模型和模糊K-Means聚类模型等算法,文章提出的自适应高斯混合模型算法能够最小化软件测试用例集,约简后的用例所覆盖的范围相对更广,测试出的软件错误率较高,对软件测试用例集多变的适应性好。 相似文献
6.
双重高斯混合模型的EM算法的聚类问题研究 总被引:2,自引:0,他引:2
EM算法是参数估计的重要方法,其算法核心是根据已有的数据来迭代计算似然函数,使之收敛于某个最优值.半监督聚类是利用少部分标签的数据辅助大量未标签的数据进行的聚类分析.文章介绍了一种基于双重高斯混合模型的EM算法,在无监督学习中增加一些已标记的样本,利用已标记的样本得到初始参数,研究了半监督条件下的双重高斯混合模型的EM聚类算法.实验表明,该算法较无监督学习而言,提升了样本的识别率,有良好的聚类性能.这种算法模型也可以作为一种基础模型,具有一定的应用领域. 相似文献
7.
吴婷 《网络安全技术与应用》2022,(4):47-49
高斯混合模型是一种含隐变量的概率图模型,其参数通常由EM算法迭代训练得到.本文在简单推导高斯混合模型的EM算法后,将使用高斯混合模型对鸢尾花(iris)数据集进行分类判别.同时,针对EM算法受初始值影响大的问题,使用了K均值聚类算法作为其初始值的估计方法.在得到K均值聚类算法和EM算法的分类判别结果后,对比两种算法的判... 相似文献
8.
针对EM算法中的初始类的数目很难决定,在迭代中经常产生部分最优的情况,将K-means算法与基于EM的聚类方法相结合,提出了一个新的适用于基因表达数据的模型聚类方法。新的聚类方法,首先利用K-means算法具有全局性、效率高的优点,快速得到聚类的起始类的划分,将其设置为高斯混合模型的初始参数值,进一步采用EM方法进行聚类,得到最优聚类结果。通过2次对真实数据集的实验测试,将新的算法分别与K均值算法和EM算法进行了比较。实验结果表明,新算法是一种有效的聚类方法,聚类结果的准确度得到了提高。 相似文献
9.
由于存在大量服从高斯分布的样本数据,采用高斯混合模型(Gaussian Mixture Models,GMM)对这些样本数据进行聚类分析,可以得到比较准确的聚类结果.通常采用EM算法(Expectation Maximization Algorithm)对GMM的参数进行迭代式估计.但传统EM算法存在两点不足:对初始聚类中心的取值比较敏感;迭代式参数估计的迭代终止条件是相邻两次估计参数的距离小于给定的阈值,这不能保证算法收敛于参数的最优值.为了弥补上述不足,提出采用密度峰值聚类(Density Peaks Clustering,DPC)来初始化EM算法,以提高算法的鲁棒性,采用相对熵作为EM算法的迭代终止条件,实现对GMM算法参数值的优化选取.在人工数据集及UCI数据集上的对比实验表明,所提算法不但提高了EM算法的鲁棒性,而且其聚类结果优于传统算法.尤其在服从高斯分布的数据集上的实验结果显示,所提算法大幅提高了聚类精度. 相似文献
10.
基于聚类算法可以对多个属性聚类的特点,提出一种基于快速求解高斯混合模型的聚类算法,用于研究网络流量的分类,使其达到更佳的聚类效果。通过与其他算法比较,讨论了该种方法在流量聚类中的适用性。仿真结果表明,该方法聚类精度高,经过初始聚类中心后的EM算法用于求解GMM有较高的估算准确性,有效地提高了EM算法的收敛速度。 相似文献
11.
12.
13.
14.
数据模型及其发展历程 总被引:1,自引:0,他引:1
数据库是数据管理的技术,是计算机学科的重要分支.经过近半个世纪的发展,数据库技术形成了坚实的理论基础、成熟的商业产品和广泛的应用领域.数据模型描述了数据库中数据的存储方式和操作方式.从数据组织形式,可以将数据模型分为结构化模型、半结构化模型、OLAP分析模型和大数据模型.20世纪60年代中后期到90年代初,结构化模型最早被提出,其主要包括层次模型、网状模型、关系模型和面向对象模型等.20世纪90年代末期,随着互联网应用和科学计算等复杂应用的快速发展,开始出现半结构化模型,包括XML模型、JSON模型和图模型等.21世纪,随着电子商务、商业智能等应用的不断发展,数据分析模型成为研究热点,主要包括关系型ROLAP和多维型MOLAP.2010年以来,随着大数据工业应用的快速发展,以NoSQL和NewSQL数据库系统为代表的大数据模型成为新的研究热点.对上述数据模型进行了综述,并选取每个模型的典型数据库系统进行了性能的分析. 相似文献
15.
形状模型在混合建模环境中的映射研究 总被引:2,自引:1,他引:1
混合建模技术是CAD研究继承参数化特征建模技术之后的又一研究热点,线框,曲面和实体模型3种模型间的转换是混合建模技术的核心,本文介绍了:1)实体模型到线框和曲面模型的映射;(2)线框模型到实体模型的映射,3)曲面框型到实体模型的映射,为混合建模技术做了一些有益的探讨,并将模型映射算法成功地应用于IGES和STEP的前后置处理器的设计中,取得了满意的结果。 相似文献
16.
基于模型操纵的模型集成的主要研究对象是模型的输入输出参数,因此,本文给出了模型的二元组表示,即输入集、输出集,提出了模型组合关系与模型集成结果等概念,具体分析了模型集成结果的存在性问题,证明了其存在的几个充分条件,在证明中给出了在满足充分条件下模型集成的构造方法. 相似文献
17.
数据在信息系统中的使用面临着这样一个困难,即:数据存储是以关系模型为基础,而软件开发以对象模型来进行,造成了软件开发中数据访问技术的不和谐。提出并建立了一个软件框架,并就对象模式到关系模式的转换进行了研究。 相似文献
18.
计算机安全中的经典模型 总被引:1,自引:2,他引:1
安全模型是构造安全计算机系统的基础。到目前为止,已有多种公开发表的安全模型。本文总结了几种重要的早期安全模型,其中包括访问矩阵模型,HRU模型,BLP模型、格模型和无干扰模型。并对它们进行了分类和简要评递。本文将它们称为经典安全模型。这些经典安全模型都是开创性的,从各个不同的方面对安全问题进行抽象,模型所定义的安全问题具有典型性,并对后续的研究产生了重要影响。目前,共享计算机系统的安全问题仍然是计算机科学的中心问题之一,研究这些经典模型,对于我们全面理解计算机系统的安全问题,展望未来发展方向,具有重要意义。 相似文献
19.
20.
在软件可靠性评估中经常用到软件可靠性模型。如何对每一特定用例进行可靠性模型的选择一直是可靠性领域研究人员的兴趣之一。文献中已有的软件可靠性模型的选择方法和工具因为使用了受限的模型选择标准而得不到广泛的应用。该文根据软件开发生命周期(SDLC)的阶段对可靠性模型进行了分类,对可靠性模型的选择提出一系列新的标准,在此基础上提出了一种新的模型选择算法并对其进行举例说明。 相似文献