首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
最大间隔聚类是近来聚类分析的一个研究热点,为进一步提高其聚类准确性,提出一种基于成对约束的半监督最大间隔聚类算法.该算法在最大间隔聚类的目标函数中添加针对成对约束的损失项,从而对违反给定约束条件的分界面进行惩罚.对所得到的非凸优化问题,本文提出一种基于约束凹凸过程的迭代算法来进行高效求解.实验表明,本文提出的算法能极大地提高最大间隔聚类的准确性,其聚类性能也明显优于其他两种半监督聚类算法.  相似文献   

2.
基于间隔的聚类是一类经典的聚类算法,此类算法假设聚类结构能通过引入监督学习中的间隔来确定.即一个好的聚类结果,当以其簇标记作为类别标记进行监督学习时,所得分类器产生的关于间隔的目标物理量也同时达到最优.目前最为有效的间隔物理量是间隔分布,其基于最新的间隔理论,取得了比优化最小间隔更好的效果.然而在现实聚类任务中,我们往...  相似文献   

3.
基于聚类的大型人脸检索系统   总被引:4,自引:0,他引:4  
刘燕  张星明  郭宇聪 《计算机工程》2005,31(15):162-164
介绍了基于聚类的大型人脸检索系统的设计思想与实现技术。该系统综合了人脸定位、人脸识别和聚类检索等技术,采用C/S模式,维护了大型的人脸数据库,提供了灵活的查询接口。实验结果表明该系统具有理想的识别率和查询速度,因此具有广泛的应用前景。  相似文献   

4.
受限于传统统计学习理论,大多数核方法都要求核矩阵半正定,但是在很多实际问题中这样的要求常常很难满足,由此产生了不定核。近年来,研究者们提出了一系列基于不定核的分类方法,取得了很好的性能,但是关于不定核聚类方法的研究相对较少,而且现有的核聚类算法基本上都是基于正定核而设计的,无法或者很难处理核矩阵不定的情况。针对此问题,以大间隔聚类(maximum margin clustering,MMC)模型为基础,提出了一种新的不定核大间隔聚类(indefinite kernel maximum margin clustering,IKMMC)算法。IKMMC算法旨在寻求一个正定核以逼近不定核,并将度量两者差异性的F-范数作为一个正则化项嵌入到MMC框架中。首先给定样本初始标记,然后迭代优化目标函数,并将每步迭代得到的样本预测错误率作为迭代终止条件。在每步迭代时,IKMMC算法进一步将目标函数转化为半无限规划(semi-infinite program,SIP)形式,并动态调整约束集进行交替优化。实验验证了IKMMC算法的有效性。  相似文献   

5.
针对应用聚类方法检测入侵中参数人为指定的问题,提出了一种新的基于无监督的聚类算法。算法通过比较无类标训练集样本间的距离,根据距离最近的样本首先聚合成类的特性,在每一步聚类结束时,先预判找出疑似入侵类,然后再对疑似入侵通过比较距离及计算类内样本数占总样本数比率来做二次检测最终确定异常类。该方法不需要人为试参数且不受数据输入顺序的影响,类的形状是任意的,能较真实的反映数据分布的真实性状。最后实验仿真结果表明该算法是有效的。  相似文献   

6.
聚类作为一种无监督的学习方法,通常需要人为地提供聚类的簇数。在先验知识缺乏的情况下,通过人为指定聚类参数是不合实际的。近年来研究的聚类有效性函数(Cluster Validity Index) 用于估计簇的数目及聚类效果的优劣。本文提出了一种新的基于有效性指数的聚类算法,无需提供聚类的参数。算法每步合并两个簇,使有效性指数值增加最大或减小最少。本文运用引力模型度量相似度,对可能出现的异常点情况作均匀化的处理。实验表明,本文的算法能正确发现特定数据的簇个数,和其它聚类方法比较,聚类结果具有较低的错误率,并在效率上优于一般的基于有效性指数的聚类算法。  相似文献   

7.
排序学习算法作为信息检索与机器学习的一个交叉领域,越来越受到人们的重视。然而,几乎没有排序学习算法考虑到查询差异的存在。文中查询被建模为多元高斯分布,KL距离被用来度量查询之间的距离,利用谱聚类方法对查询进行聚类,为每个聚类类别训练一个排序函数。实验结果表明经过聚类得到的排序函数需要较少的训练样例,但是它的性能却和没有经过聚类得到的排序函数具有可比性,甚至优于后者。  相似文献   

8.
聚类是无监督机器学习算法的一个分支,它在信息时代具有广泛的应用。然而,在多样化的聚类算法研究中,常存在密度计算需要指定固定的近邻数、需要提前指定簇数目、需要多次迭代完成信息叠加更新等问题,这些问题会让模型丢失部分数据特征,也会加大计算量,从而使得模型的时间复杂度较高。为了解决这些问题,受萤火虫发光和光信息传递、交流的启发,提出了一种萤光信息导航聚类算法(firefly luminescent information navigation clustering algorithm, FLINCA)。该方法由腐草生萤和聚萤成树两大模块构成,首先将数据点视作萤火虫,并采用自适应近邻数的方式确定萤火虫亮度,通过亮度完成萤火虫初步聚类,然后再根据萤火虫树进行簇融合,完成最终聚类。实验证明,与12种不同的算法进行对比,FLINCA在4个聚类benchmark数据集和3个多维真实数据集上表现出较好的聚类效果。这说明基于萤火虫发光和光信息传递的FLINCA算法在聚类问题中具有广泛的应用价值,能够有效解决传统聚类算法中存在的问题,提高聚类结果的准确率。  相似文献   

9.
宋艳  殷俊 《计算机应用》2005,40(11):3211-3216
为了解决谱聚类算法中相似矩阵的构造不能满足簇内数据点高度相似的问题,给出一种基于共享近邻的多视角谱聚类算法(MV-SNN)。首先,算法通过提高共享近邻个数多的两个数据点的相似度,使同簇的数据之间的相似度更高;然后,将改进后的多个视角的相似矩阵进行相加从而整合得到全局相似矩阵;最后,为了解决一般谱聚类算法在后期仍需要通过k均值聚类算法进行数据点划分的问题,给出拉普拉斯矩阵秩约束的方法,从而直接通过全局相似矩阵得到最终的类簇结构。实验结果表明,对比其他几种多视角谱聚类算法,MV-SNN算法在三个聚类衡量标准:准确度、纯度和归一化互信息上的性能提高了1%~20%,在聚类时间上减少了50%左右,可见MV-SNN算法的聚类性能更好,用时更短。  相似文献   

10.
聚类是应用于视频监控系统背景建模的新方法,其中MMC(最大间隔聚类)方法是实验效果相对较好的方法,但是这种方法的缺点是运算量大、对计算机内存的要求较高.为了解决上述的问题,提出了基于SVR(支持向量回归)的背景建摸方法,用SVR代替原方法中的SVM(支持向量机)的聚类方法.利用该方案实现了视频监控仿真系统中的背景建模实验.实验结果表明所提出的方法不仅能加快背景建模的速度,并且在一定程度上减弱了视频监控系统背景建模时的噪声.  相似文献   

11.
为解决人脸特征提取过程中局部特征缺失的问题,借助局部二值模式(LBP)与方向梯度直方图(HOG)提出一种基于多级纹理特征融合的深度信念网络人脸识别算法。以提取局部纹理特征以及边缘纹理特征为出发点,对人脸图像进行三级纹理特征提取。使用MB-LBP提取初级纹理特征;在此基础上进行改进的CS-LBP图像特征提取作为二级纹理特征;使用HOG算子在二级纹理特征上完成三级纹理特征提取。将二级和三级纹理特征直方图顺序串联融合后输入到深度信念网络(DBN)逐层贪婪训练,优化网络参数,并用优化的网络在ORL、YELA人脸标准库中进行测试,识别率均在92%以上。该算法与传统算法(SVM、PCA)相比较拥有更好的人脸识别效果,同时也表明了局部纹理特征的改善为识别过程的特征提取提供强有力的保障,为人脸识别的进一步研究开拓新思路。  相似文献   

12.
基于密度的方法和基于距离的方法是两类常用的对象聚类方式。本文提出了一种基于对象“形状”的聚类算法,外表面距离为零的对象将被自动聚为一类。文中给出了对象形状的定义,有形对象之间距离的计算方法,以及基于对象形状的聚类算法。最后给出一个具体实例,说明了理论和实际的相容性。  相似文献   

13.
提出一种基于多尺度LBP(Local Binary Pattern)的人脸识别算法。建立人脸图像高斯差分尺度空间,计算尺度空间图像的LBP特征,将LBP特征图像划分为互不重叠的特征区域,然后分别进行直方图统计,最后将所有区域的LBP直方图序列连接起来得到多尺度LBP特征,采用最近邻分类器对人脸图像分类识别。实验分析表明,多尺度LBP特征具有较强的人脸图像描述能力,能够提取到更加丰富的全局信息,鲁棒性强,在识别率和识别速度上均比SIFT算法高。  相似文献   

14.
一种基于混合遗传算法的聚类方法   总被引:1,自引:0,他引:1  
针对遗传算法在聚类时存在的搜索速度慢和早熟的问题,将禁忌搜索的自适应优点引入遗传操作来改良其全局搜索性能,并采用带有权重的相似性度量方法,提出了一种基于混合遗传算法的聚类算法.通过与常用的聚类方法的实验结果比较,表明这种方法具有良好的聚类效果.  相似文献   

15.
提出了一种基于混合核函数支持向量机和遗传算法的识别方法,用于人脸识别。该方法结合了支持向量机的学习性能和遗传算法的寻优性能,与传统的方法相比,具有速度快、误差少、效率高的特点,在实验中能够较精确地对人脸进行识别。  相似文献   

16.
不平衡分类在现实生活中有着广泛应用,提高不平衡数据的分类精度一直是相关领域中的热门课题。针对已有欠采样方法容易保留多数类噪声样本的问题,提出一种基于聚类融合欠采样的改进欠采样方法。结合聚类融合与孤立森林(Isolation Forest,iForest)方法,筛选、删除异常指数高的多数类噪声样本,有效提高模型中的样本质量,增强欠采样算法的抗噪声能力。在7个UCI和KEEL不平衡数据集上的实验结果表明,该算法在处理不平衡分类问题时,AUC值和F1值均有一定程度的提升。将算法应用在蛋白质定位预测,提升了预测效果。  相似文献   

17.
分析目前基于聚类思想的遗传算法的不足,提出一种基于生长树聚类的改进型遗传算法。采用最小生成树的聚类方法,能对形状复杂且非重叠样本的候选解进行聚类形成家族;新的族间交叉算子保持了种群的多样性;改进的族内交叉算子和改进的变异算子使得算法在后期仍能快速收敛;实验对经典算法测试函数进行优化,并与其他算法的优化结果对比,从而说明改进型遗传算法的性能。实验结果表明:基于生长树聚类的改进型遗传算法能有效提高求解精度,快速搜索到最优解。  相似文献   

18.
为配合刑事侦查工作和公安网上追逃的迫切需要,对人脸模拟画像的检索作初步研究.首先,根据网上追逃数据库中的人脸照片设计出一种半自动的归一化算法.其次,研究了人脸模拟画像和人脸照片的边缘检测方法,给出一种自适应的人脸照片边缘检测算法,从而得到三种用于人脸模拟画像检索的统计特征.最后,建立了人脸模拟画像检索的实验数据库,给出相似性量度,并对实验数据进行了分析.为构建实用的人脸模拟画像检索系统的开发提供了理论支持;对金盾工程的完善起到良好的促进作用.  相似文献   

19.
针对传统基于距离度量的聚类算法难以适合高维数据聚类以及高维数据之间相似度难定义的问题,提出了一种新的高维数据聚类算法.该算法基于一个能够更准确地表达出高维对象之间相似性的度量函数,首先计算对象两两之间的相似度并得出一个相似度矩阵,然后根据该相似度矩阵和阈值大小自底向上对数据进行聚类分析.实验结果显示,该算法能够获得质量更高的聚类结果,并且不受孤立点影响,对输入数据顺序也不敏感.  相似文献   

20.
根据决策规则在实际应用中的匹配思想,对数值型一致决策表提出了一种基于模糊聚类方法的决策表约简方法.该方法在保持决策表一致性的前提下,通过冗余度大小的调整,对具有相同决策的对象进行压缩,从而达到对决策表约简的目的.基于计算相关规则的直接分类法验证结果显示,它是有效和可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号