首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
将极大熵原理引入半监督聚类方法中,提出基于辅助空间与极大熵的半监督聚类算法AMESC,针对该算法中的代价函数进行迭代优化,实现聚类。AMESC的优势在于它依据模拟退火过程,使算法避开局部极小而得到全局极小,提高算法性能。通过实验证实了AMESC的有效性和优越性。  相似文献   

2.
3.
极大熵聚类算法(MEC)是基于信息论的新型聚类算法。以不同子集之间的协同关系为出发点,与信息理论中的极大熵原理相结合,通过构造新的极大熵目标函数来改变传统聚类算法中对整个数据集直接聚类的机制。提出一种基于协同的极大熵聚类算法CMEC,它不仅具有较MEC算法更高的聚类精度和更好的泛化性等特点,较之协同模糊聚类算法还具有更好的物理意义。实验结果表明所提出的CMEC算法具有上述优点,其聚类效果比传统的聚类算法有了很大的提高。  相似文献   

4.
极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC的目标函数中,通过拉格朗日最优化处理目标函数,得出聚类中心与隶属度的迭代公式.实验表明,文中算法能有效利用少量的成对约束监督信息提高聚类性能,在实际数据应用中性能较好  相似文献   

5.
陈爱国    王士同 《智能系统学报》2017,12(1):95-103
针对传统的聚类算法在样本数据量不足或样本受到污染情况下的聚类性能下降问题,在经典的极大熵聚类算法(MEKTFCA)的基础上,提出了一种新的融合历史聚类中心点和历史隶属度这两种知识的基于极大熵的知识迁移模糊聚类算法。该算法通过学习由源域总结出来的有益历史聚类中心和历史隶属度知识来指导数据量不足或受污染的目标域数据的聚类任务,从而提高了聚类性能。通过一组模拟数据集和两组真实数据集构造的迁移场景上的实验,证明了该算法的有效性。  相似文献   

6.
丁健宇  祁云嵩  赵呈祥 《计算机应用研究》2022,39(4):1019-1023+1059
在数据稀少、数据维度高、多视角聚类任务的情况下,传统极大熵聚类算法会因类中心趋于一致,从而导致聚类失败。为解决此类问题,在传统极大熵聚类算法的基础上,引入类中心惩罚机制,融合权重矩阵实现多视角划分融合,构建出类中心极大的多视角极大熵聚类算法。该算法通过调整每个视角上的权重来体现某个视角的重要性,并通过类中心极大惩罚项解决了多视角聚类任务下,因数据稀少、数据维度高导致每个视角上的类中心趋于一致的问题。通过大量实验进一步证明,该算法在处理高维度、数据稀少、存在干扰数据和多视角的数据集时,其聚类效果明显优于传统的聚类算法。  相似文献   

7.
有约束的半监督聚类方法   总被引:1,自引:1,他引:0       下载免费PDF全文
在数据挖掘领域的很多实际应用中,获取大量的无标签样本非常容易,而获取有标签的样本通常需要付出较大的代价,并且有时不可能得到所有的数据的标签,半监督聚类就是使用一小部分的标签数据对无标签数据的聚类过程进行指导。提出了一种新的半监督聚类算法,它利用标签数据提供的信息来初步确定数据的相似性和不相似性标准,并在聚类过程中对其进行自动调整,利用它们对聚类过程进行约束和指导。通过在标准数据集高斯数据集上的测试,该算法相对于无指导聚类来说有更高的精度和更快的速度。  相似文献   

8.
通过对几种典型聚类算法的分析和比较,提出了一种新的聚类算法,基于扩展约束的半监督谱聚类算法,简称CE-SSC。这种算法扩展了已知约束集,通过密度敏感距离改变样本点的相似关系,结合半监督谱聚类进行聚类。在UCI基准集上的仿真实验结果证明,基于扩展约束的半监督谱聚类算法具有良好的聚类效应。  相似文献   

9.
半监督的仿射传播聚类   总被引:4,自引:0,他引:4       下载免费PDF全文
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。  相似文献   

10.
为解决数据不足或失真等环境下传统聚类技术效果不佳的问题,基于历史类中心和历史隶属度提出两种知识迁移机制,并与极大熵聚类方法融合提出知识迁移极大熵聚类算法KT-MEC. KT-MEC的优点是:利用历史知识, KT-MEC聚类有效性和实用性明显增强;内嵌迁移机制均不暴露源域数据,从而拥有源域隐私保护能力;KT-MEC基于的“参数寻优+聚类有效性度量”机制理论上保证其性能不差于经典极大熵算法,避免了负迁移问题.  相似文献   

11.
近年来,随着科技的快速发展,数据呈现了爆炸式增长趋势,面对如此巨量的多源数据,如何正确识别实体,为数据分析提供高质量的数据是提高企业效益、指导企业决策的重中之中。笔者通过研究基于图的半监督可能性聚类方法,对相同实体进行有效统一,解决了数据分析之初的数据质量问题,通过实验证明了算法的有效性。  相似文献   

12.
基于空间模式聚类最大熵图像分割算法研究   总被引:3,自引:0,他引:3  
陈秋红  沈云琴 《计算机仿真》2012,29(1):214-216,326
研究图像分割优化问题,在分割图像中,提取信息受到各种因素影响,分割效果不理想。针对图像分割计算复杂,造成图像分割分辨率低,清晰度不高。同时,当图像中的信息量非常大时,图像分割非常耗时。为了有效地分割图像,提出了一种基于空间模式聚类和最大熵算法原理相结合的图像分割方法。首先对图像采用最大熵算法进行图像分割,为每个熵区域定义特征量。根据不同的特征量计算相似区域之间的欧氏距离和空间距离,从而确定像素聚类中心的距离。然后对分割后的图像区域采用基于空间模式聚类方案进行合并,并对图像进行二值化处理。仿真表明与传统图像分割相比,提高了分割效率,分割出的图像边缘效果清晰,证明了算法的可行性和有效性。  相似文献   

13.
当前,极大熵聚类(maximum entropy clustering,MEC)在面对多视角聚类任务时,是将多视角样本合并成为一个整体样本再进行处理,然而这样会破坏各视角的独立性特征,进而影响最终的划分结果。针对该问题,首先提出多视角协同划分极大熵聚类算法(multi-view collaborative partition MEC,Co MEC),该算法加入一个协调各视角空间划分的约束项,使得每一视角在单独聚类过程中考虑到其他视角的影响;然后通过区分每个视角的重要性将Co MEC算法扩展为视角加权版本,即视角加权协同划分极大熵聚类算法(view weighted collaborative partition MEC,W-Co MEC);最后利用几何均值的集成策略得到全局性的划分结果。在人工数据集以及UCI数据集上的实验结果均显示所提算法较之已有的聚类技术在应对多视角聚类任务时具有更好的聚类性能。  相似文献   

14.
沙秀艳  辛杰 《计算机工程》2011,37(10):187-188
传统聚类算法易陷入局部极值,在数据线性不可分时分类效果较差。为此,提出一种基于最大熵的模糊核聚类图像分割方法。采用最大熵算法对原始图像进行初步分割,求得初始聚类中心;引入Mercer核函数,把输入空间的样本映射到高维特征空间,并在特征空间中进行图像分割。实验结果表明,该方法能减少迭代次数,使分类结果更稳定,从而较好地把目标从背景中分割出来。  相似文献   

15.
基于Mean Shift聚类的最大熵图像分割方法   总被引:4,自引:1,他引:3  
廖建勇  郭斯羽  黄梓效 《计算机仿真》2009,26(9):187-189,222
为了有效的分割图像,在考虑了图像的噪声消除和边缘保持等因素的基础上,为解决上述问题,提出一种Mean Shift的图像平滑方法和最大熵的图像分割方法相结合的图像分割方法,Mean Shift对图像进行平滑能有效去除图像中的噪声,同时能很好的保持图像的边缘,克服了以往平滑方法的弱点,再通过基于最大熵阈值对平滑后图像进行图像分割,经过实验证明,与小波平滑等目前其他的平滑方法和最大熵分割结合相比,方法有效的改善了分割效果。  相似文献   

16.
针对传统基于最大熵模糊 C 均值聚类算法(MEFCM)仅适用于球状或椭圆状聚类,为了解决数据分布混乱以及高度相关难以划分的情形,引入 Mercer 核函数,使原来没有显现的特征突现出来,从而使聚类效果更好。然而在实际问题中,大多数样本集的样本数据都存在着重要性(权重)不同的现象,主要针对样本集中各个数据的不同重要程度来设计加权方法,同时为了克服聚类算法对初始聚类中心选取的敏感性这一弱点,提出了一个初始聚类中心优化的加权最大熵核模糊聚类算法(WKMEFCM)。通过实验验证,该算法与原MEFCM算法比较,其聚类结果更加稳定、准确,从而达到更好的聚类划分效果。  相似文献   

17.
融合聚类触发对特征的最大熵词性标注模型   总被引:7,自引:0,他引:7  
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择.在最大熵框架下,将选择后的触发对特征加入到词性标注系统中.利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“%”的数据稀疏问题.实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%.  相似文献   

18.
随着网络规模的不断扩大,通用的检索模型无法达到准确性的需求.网页主题判定可以提高系统对数据的管理能力和检索结果的精度.结合前人的研究成果,本文拟采用最大熵模型实现对网页主题的判定.  相似文献   

19.
基于生成对抗网络的图像识别方法拥有很高的识别率,但训练时需要大量有标签样本,在有标签样本较少的情况时识别效果不佳。针对这个问题,结合深度卷积生成对抗网络和半监督生成对抗网络的特点建立半监督深度生成对抗网络。根据有标签样本和无标签样本分布,模型生成拟合真实分布的样本输入并训练分类器,增加了训练样本数从而提升识别率。将模型优化调整并进行图像识别实验,结果表明,该方法仅用少量有标签样本即可实现准确的图像识别。  相似文献   

20.
共指消解是文本信息处理中的一个重要问题.提出了一种有监督的关联聚类算法以实现对中文实体提及的共指消解.首先将共指消解过程看成图的关联聚类问题,从全局的角度实现对共指等价类的划分,而不是孤立地对每一对名词短语分别进行共指决策;然后给出了关联聚类的推导算法;最后设计了一种基于梯度下降的特征参数学习算法,使得训练出的特征参数能够较好拟合关联聚类的目标.在ACE中文语料上的实验结果显示,该算法优于传统的"分类一聚类"共指消解学习算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号