共查询到20条相似文献,搜索用时 46 毫秒
1.
将极大熵原理引入半监督聚类方法中,提出基于辅助空间与极大熵的半监督聚类算法AMESC,针对该算法中的代价函数进行迭代优化,实现聚类。AMESC的优势在于它依据模拟退火过程,使算法避开局部极小而得到全局极小,提高算法性能。通过实验证实了AMESC的有效性和优越性。 相似文献
3.
江森林 《计算机应用与软件》2014,(5):268-271,278
极大熵聚类算法(MEC)是基于信息论的新型聚类算法。以不同子集之间的协同关系为出发点,与信息理论中的极大熵原理相结合,通过构造新的极大熵目标函数来改变传统聚类算法中对整个数据集直接聚类的机制。提出一种基于协同的极大熵聚类算法CMEC,它不仅具有较MEC算法更高的聚类精度和更好的泛化性等特点,较之协同模糊聚类算法还具有更好的物理意义。实验结果表明所提出的CMEC算法具有上述优点,其聚类效果比传统的聚类算法有了很大的提高。 相似文献
4.
极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC的目标函数中,通过拉格朗日最优化处理目标函数,得出聚类中心与隶属度的迭代公式.实验表明,文中算法能有效利用少量的成对约束监督信息提高聚类性能,在实际数据应用中性能较好 相似文献
5.
6.
在数据稀少、数据维度高、多视角聚类任务的情况下,传统极大熵聚类算法会因类中心趋于一致,从而导致聚类失败。为解决此类问题,在传统极大熵聚类算法的基础上,引入类中心惩罚机制,融合权重矩阵实现多视角划分融合,构建出类中心极大的多视角极大熵聚类算法。该算法通过调整每个视角上的权重来体现某个视角的重要性,并通过类中心极大惩罚项解决了多视角聚类任务下,因数据稀少、数据维度高导致每个视角上的类中心趋于一致的问题。通过大量实验进一步证明,该算法在处理高维度、数据稀少、存在干扰数据和多视角的数据集时,其聚类效果明显优于传统的聚类算法。 相似文献
7.
刘应东 《计算机工程与应用》2009,45(22):100-102
在数据挖掘领域的很多实际应用中,获取大量的无标签样本非常容易,而获取有标签的样本通常需要付出较大的代价,并且有时不可能得到所有的数据的标签,半监督聚类就是使用一小部分的标签数据对无标签数据的聚类过程进行指导。提出了一种新的半监督聚类算法,它利用标签数据提供的信息来初步确定数据的相似性和不相似性标准,并在聚类过程中对其进行自动调整,利用它们对聚类过程进行约束和指导。通过在标准数据集高斯数据集上的测试,该算法相对于无指导聚类来说有更高的精度和更快的速度。 相似文献
8.
通过对几种典型聚类算法的分析和比较,提出了一种新的聚类算法,基于扩展约束的半监督谱聚类算法,简称CE-SSC。这种算法扩展了已知约束集,通过密度敏感距离改变样本点的相似关系,结合半监督谱聚类进行聚类。在UCI基准集上的仿真实验结果证明,基于扩展约束的半监督谱聚类算法具有良好的聚类效应。 相似文献
9.
10.
为解决数据不足或失真等环境下传统聚类技术效果不佳的问题,基于历史类中心和历史隶属度提出两种知识迁移机制,并与极大熵聚类方法融合提出知识迁移极大熵聚类算法KT-MEC. KT-MEC的优点是:利用历史知识, KT-MEC聚类有效性和实用性明显增强;内嵌迁移机制均不暴露源域数据,从而拥有源域隐私保护能力;KT-MEC基于的“参数寻优+聚类有效性度量”机制理论上保证其性能不差于经典极大熵算法,避免了负迁移问题. 相似文献
11.
12.
基于空间模式聚类最大熵图像分割算法研究 总被引:3,自引:0,他引:3
研究图像分割优化问题,在分割图像中,提取信息受到各种因素影响,分割效果不理想。针对图像分割计算复杂,造成图像分割分辨率低,清晰度不高。同时,当图像中的信息量非常大时,图像分割非常耗时。为了有效地分割图像,提出了一种基于空间模式聚类和最大熵算法原理相结合的图像分割方法。首先对图像采用最大熵算法进行图像分割,为每个熵区域定义特征量。根据不同的特征量计算相似区域之间的欧氏距离和空间距离,从而确定像素聚类中心的距离。然后对分割后的图像区域采用基于空间模式聚类方案进行合并,并对图像进行二值化处理。仿真表明与传统图像分割相比,提高了分割效率,分割出的图像边缘效果清晰,证明了算法的可行性和有效性。 相似文献
13.
《计算机科学与探索》2016,(4):554-564
当前,极大熵聚类(maximum entropy clustering,MEC)在面对多视角聚类任务时,是将多视角样本合并成为一个整体样本再进行处理,然而这样会破坏各视角的独立性特征,进而影响最终的划分结果。针对该问题,首先提出多视角协同划分极大熵聚类算法(multi-view collaborative partition MEC,Co MEC),该算法加入一个协调各视角空间划分的约束项,使得每一视角在单独聚类过程中考虑到其他视角的影响;然后通过区分每个视角的重要性将Co MEC算法扩展为视角加权版本,即视角加权协同划分极大熵聚类算法(view weighted collaborative partition MEC,W-Co MEC);最后利用几何均值的集成策略得到全局性的划分结果。在人工数据集以及UCI数据集上的实验结果均显示所提算法较之已有的聚类技术在应对多视角聚类任务时具有更好的聚类性能。 相似文献
14.
15.
16.
针对传统基于最大熵模糊 C 均值聚类算法(MEFCM)仅适用于球状或椭圆状聚类,为了解决数据分布混乱以及高度相关难以划分的情形,引入 Mercer 核函数,使原来没有显现的特征突现出来,从而使聚类效果更好。然而在实际问题中,大多数样本集的样本数据都存在着重要性(权重)不同的现象,主要针对样本集中各个数据的不同重要程度来设计加权方法,同时为了克服聚类算法对初始聚类中心选取的敏感性这一弱点,提出了一个初始聚类中心优化的加权最大熵核模糊聚类算法(WKMEFCM)。通过实验验证,该算法与原MEFCM算法比较,其聚类结果更加稳定、准确,从而达到更好的聚类划分效果。 相似文献
17.
融合聚类触发对特征的最大熵词性标注模型 总被引:7,自引:0,他引:7
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择.在最大熵框架下,将选择后的触发对特征加入到词性标注系统中.利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“%”的数据稀疏问题.实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%. 相似文献
18.
李欣昱 《计算机光盘软件与应用》2011,(11)
随着网络规模的不断扩大,通用的检索模型无法达到准确性的需求.网页主题判定可以提高系统对数据的管理能力和检索结果的精度.结合前人的研究成果,本文拟采用最大熵模型实现对网页主题的判定. 相似文献
19.