首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 17 毫秒
1.
基于聚类的人脸图像检索及相关反馈   总被引:3,自引:1,他引:2  
杨之光  艾海舟 《自动化学报》2008,34(9):1033-1039
提出了一种基于聚类的人脸图像检索算法. 首先利用归一化分割(Normalized cuts, NCuts)在每个时间段内分别对人脸聚类, 使同一个人在不同情况下的人脸图像聚为一类. 其次采用连续AdaBoost算法学习得到的人脸识别分类器度量人脸之间的相似度, 并进一步提出查询人脸与人脸聚类之间的相似度用于检索. 为了进一步提高性能, 用户可以在线标定错检和漏检的结果, 相关反馈环节把用户的交互标定结果作为约束条件重新对人脸聚类. 本文把人脸图像检索算法应用于自动的检索系统中, 在包含超过一千张人脸图像的家庭数码相册上, 通过与其他方法的对比实验证明了基于聚类的人脸图像检索算法是有效的.  相似文献   

2.
目前基于相似度的聚类方法对风电出力场景进行聚类划分,而相似度又大多采用欧式距离长短作为衡量依据,其结果反映时间序列曲线的幅度大小差异,未能反映出曲线的形态特征及变化趋势的不同.本文提出一种基于高斯混合聚类的风电出力场景划分的方法,即通过属于某一类的概率大小来判断最终的归属类别.首先根据BIC准则,肘部法则和轮廓系数分别...  相似文献   

3.
基于用户浏览行为聚类Web用户   总被引:3,自引:0,他引:3  
本文结合Web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后,使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader算法聚类Web用户的有效性.  相似文献   

4.
为优化文本聚类效果,提出一种基于单词超团理论的文本聚类方法.利用文档中单词的关联模式来评估文档间的相似度,将单词超团作为文档向量辅助信息,以图划分的方式进行聚类分析.对不同聚类方法的结果进行比较,证明基于单词超团的文本聚类方法能提高文本聚类的准确性.  相似文献   

5.
聚类分析是Web日志挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性.本文引入一种向量聚类方法,并针对原有方法的不足提出改进.首先分析用户事务求出用户事务的相似矩阵,通过分别计算用户事务相似度和用户浏览路径相似度,然后把两者平均得到不同用户事务之间的相似性系数,最后根据相似性系数方法得出聚类结果.这种算法考虑到了web用户访问的有序、连续、重复性,结果能够真正反映出用户的浏览兴趣.  相似文献   

6.
词语相似度的计算是人工智能领域的一个基础性的研究课题,它在自然语言处理,QA平台的搭建、语义消歧、文本的聚类和分类这些问题有着很广泛的应用.提出一种基于同义词词林的中文单词相似度计算方法,通过两个单词在词林树中相距的路径长,以及所在分支词义密度来计算两个中文单词间的相似度,并通过观察计算相似性的结果和人主观感觉的相似性的结果的皮尔逊线性相关系数来评价该方法.  相似文献   

7.
推荐系统中,基于聚类的协同过滤推荐算法利用K-means等算法对用户和物品进行聚类,聚类结果里用户或物品只能属于一个类别,然而在实际应用中,一个用户可以有多种兴趣,一个物品也可以属于多个类别。针对上述问题,提出了一种基于谱聚类群组发现的算法,该算法通过谱聚类和C-means聚类得到用户和物品相似度较高的群组以及用户和物品归属于群组的隶属度矩阵,而且用户或物品可以属于多个群组。通过计算用户在各个群组中对物品的偏好值,并结合用户和物品在群组里相应的隶属度来预测用户对物品最终的偏好值,生成对用户的Top-N推荐结果。实验结果表明,与以往推荐算法相比,本方法在降低了数据稀疏性的同时提高了推荐结果的准确率和召回率。  相似文献   

8.
通过定义子空间结构化低秩正则项,将其与子空间结构化稀疏子空间聚类模型相结合,给出一个新的统一优化模型。新模型利用数据的类别属性和相似度互相引导,使得相似度具有判别性和一致性,类别属性具有一致性。相似度的判别性有利于将不同子空间的数据分为不同类,而一致性有利于将同一子空间的数据聚为一类。大量实验表明提出的方法优于一些典型的两步法和子空间结构化稀疏子空间聚类模型。  相似文献   

9.
针对传统协同过滤算法由于数据稀疏和冷启动而造成的推荐精度下降的问题,提出一种基于联合聚类和C-RA组合相似度的协同过滤算法。首先,通过联合聚类对原始评分矩阵进行用户和物品两个维度的聚类;其次,利用联合聚类结果填充原始评分矩阵;最后,利用C-RA组合相似度计算用户相似度并进行推荐。实验结果表明,该方法有效地提高了推荐结果的精确度,缓解了数据稀疏和冷启动问题。  相似文献   

10.
免疫规划+K均值混合聚类算法   总被引:2,自引:0,他引:2  
1.引言聚类分析(Clustering Analysis)是一种无监督的模式识别方法。聚类产生的每一组数据称为一个簇,簇中的每一数据称为一个对象。聚类的目的是使同一簇中对象的特性尽可能地相似,而不同簇对象间的特性差异尽可能地大。聚类的任务是把一个未标记的模式按某种准则划分成若干子集,要求相似的样本尽量归为同一类,而不相似的样本归为不同的类,故又称无监督分类。目前,各种聚类方法已广泛应用于数据挖  相似文献   

11.
基于单词相似度的文本聚类   总被引:3,自引:1,他引:3  
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点.针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类.实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果.  相似文献   

12.
时间序列相似度是时间序列数据挖掘的重要研究方向之一。如何利用时间序列相似度对提高时间序列数据聚类有着重要的意义。提出一种基于时间序列相似度的半监督谱聚类算法,通过选取适当的时间序列特征构造相似度与距离,在谱聚类算法的基础上利用标签数据选取初始类簇。实验表明,该算法使具有相似特征的时间序列可以很有效地被聚集到同一类中。  相似文献   

13.
点击流数据是分析互联网用户心理倾向的关键,互联网用户的聚类可以通过分析点击流数据实现. 本文提出了一种基于向量的相似度计算方法,将点击流数据转化为向量数据. 通过对向量的计算来得出聚类的结果. 算法克服了传统的聚类算法的一些缺点,更能符合研究人员研究Web点击流数据时关于个性化聚类的要求.  相似文献   

14.
通过获取的匿名用户浏览路径集,依据新的路径相似度定义,建立用户浏览路径相似度矩阵,并在此基础上设计实现了匿名用户浏览路径聚类算法,获得聚类结果集,并计算各类的中心,得到典型匿名用户路径.挖掘结果显示典型匿名用户路径代表了不同类用户网络浏览路径,可有效地作为网站信息推荐的依据.  相似文献   

15.
K-means算法的基本思想是通过迭代方法把所有的元素都唯一聚类到不同的簇中,使得同一簇中的质点具有最小相异度,不同簇间的元素具有最大相异度。但是,这种聚类方法使得那些属于不同簇的交叉区域中的质点也被简单地聚类到了某个簇中,因此无法表达某些元素的跨簇特性。本文提出了基于模糊逻辑的K-means算法,利用模糊逻辑来计算不同簇交叉区域中质点属于某个簇的权重,在获得聚类结果的同时可以有效描述质点的跨簇特性。实验结果表明该算法是有效的。  相似文献   

16.
不完整数据的分析与填充一直是大数据处理的热点研究课题,传统的分析方法无法对不完整数据直接聚类,大部分方法先填充缺失值,然后对数据聚类。这些方法一般利用整个数据集对缺失数据进行填充,使得填充值容易受到噪声的干扰,导致填充结果不精确,进而造成聚类精度很低。提出一种不完整数据聚类算法,对不完全信息系统的相似度公式进行重新定义,给出不完整数据对象间的相似度度量方式,进而直接对不完整数据聚类。根据聚类结果将同一类对象划分到相同的簇中,通过同一类对象的属性值对缺失值进行填充,避免噪声对填充值的干扰,提高填充结果的精确性。实验结果表明,提出的方法能够对不完整数据进行聚类,并有效提高缺失数据的填充精度。  相似文献   

17.
在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.  相似文献   

18.
介绍一种基于模糊逻辑的数据聚类技术,讨论了模糊C均值聚类方法。模糊C均值算法就是利用模糊逻辑理论和聚类思想,将n样本划分到c个类别中的一个,使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。  相似文献   

19.
多视角聚类能够整合多个视角的信息来提高聚类效果.目前很多研究都限于关注多视角一致性,得到的统一相似度图中仍存在许多非同簇之间的关系,甚至当某些簇的噪声达到一定程度时还可能导致统一相似度图难以形成簇的块对角结构.为此,本文提出一种块对角引导的多视角统一图聚类方法,该方法先将不同视角的相似度图分解成一致性部分与不一致性部分;然后通过构造不一致性关系来获得更纯净的一致性部分;进而融合所有视角的一致性部分建立一个相似度图;最后在该相似度图中加入块对角引导和连通分量约束,学习到高质量的统一相似度图.通过在六个数据集上进行对比实验,证明了本文提出的方法的有效性.  相似文献   

20.
基于项目聚类的全局最近邻的协同过滤算法   总被引:1,自引:0,他引:1  
用户评分数据极端稀疏的情况下,传统相似性度量方法存在弊端,导致推荐系统的推荐质量急剧下降。针对 此问题,提出了一种基于项目聚类的全局最近部的协同过滤算法。该算法根据项目之间的相似性进行聚类,使得相似 性较高的项目聚成一类,在项目聚类集的基础上,计算用户的局部相似度,使用一种新的最近部用户全局相似度作为 衡量用户间相似性的标准;其次,给出了一种利用重叠度因子来调节局部相似度的方法,以更准确地刻画用户之间的 相似性。实验结果表明,该算法可以提升预测结果的准确性,提高推荐质量,特别是在数据较为稀疏时,改善尤为明 显。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号