首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对图像聚类中数据量大、部分重叠等问题,提出一种基于滑动窗口的多标记传播聚类算法。首先根据图像距离计算图像间的相似度,设定阈值将相似度转变为链接,构造出一个无向图;然后应用基于滑动窗口的多标记传播算法对无向图进行社区划分。滑动窗口可以存放多个标记,从而一个图像可以归属于多个类别。对公开网络数据和搜索引擎返回的真实图像数据进行实验,结果表明,该方法能有效发现具有重叠划分的簇,且簇的意义比较明确。  相似文献   

2.
一种代表点的近似折半层次聚类算法   总被引:1,自引:0,他引:1  
针对传统的代表点聚类算法对收缩因子的敏感性和聚类数不适应数据的动态变化等问题,综合研究凝聚型层次聚类问题,提出一种代表点的近似折半层次聚类算法——ABHCURE(Approximate Binary Hierarchical Clustering Using Representatives),有效地解决了离群数据点对聚类结果的影响和聚类数的难确定问题.首先,提出单层多簇合并模式来提高算法的执行效率.其次,为了避免选择离群数据成为簇的代表点破坏原始数据分布,引入准噪声机制收集各层的准噪声数据增强算法的鲁棒性.最后,通过动态最小聚类数确定方式实现聚类数需求和确定难度的折衷.实验结果表明,该算法不仅运行时间相对较短,具有灵活的聚类数,还可以得到更高精确的聚类结果.  相似文献   

3.
k中心点聚类算法在层次数据的应用   总被引:2,自引:0,他引:2  
探讨了近年来提出的聚类概念与聚类过程、k中心点聚类的算法,在此基础上提出了一种基于层次数据模型的k中心聚类的改进算法.该算法一方面针对层次变量提出了相关的中值点概念;另一方面对传统k中心点算法进行了改进.最后对改进算法的复杂度进行了分析,由分析结果得出改进算法要比传统k中心点算法每次迭代耗费时间略少,但在总耗费时间上远远小于k中心点算法,大幅度提高了算法的整体性能.  相似文献   

4.
BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。  相似文献   

5.
基于代表点的快速聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对传统的层次聚类算法每次迭代只将距离最小的那对类簇合并,容易受离群点影响,偏向于发现凸状或球状簇等缺点,受CURE算法启发,采用簇中固定数量代表点来代表簇对象进行距离的计算,并结合90_10规则,提出了一种改进的层次聚类算法REPBFC(REpresentative Points Based Fast Clustering),实验表明该算法是有效的。  相似文献   

6.
在图像分类中,视觉词典的质量直接影响着图像分类的结果,随着用户的要求提高,K-means聚类算法所构建的视觉词典已无法满足用户对图像分类的需求,为了得到高效的视觉词汇码本,针对构建视觉词典的算法进行研究,通过K-means算法和层次聚类算法的结合来达到这一目的。混合聚类算法采用K-means算法对数据样本进行初步聚类,得到一个粗略的划分;引入信息熵的属性加权,利用信息熵度量某个属性的关键性,信息熵越大的属性对聚类结果的影响越小,计算加权后的类间欧式距离,将距离相近的两个类进行合并;在空间金字塔模型框架中,将改进的混合聚类方法应用到视觉词典的构建中。实验结果表明,结合信息熵的层次聚类算法能有效提高空间金字塔模型的分类准确率。  相似文献   

7.
模糊C均值算法用于图像聚类时,仅考虑图像的灰度信息,忽略灰度的空间分布,未充分利用分割前后图像间的关系。从分割后图像的类距离出发,并利用聚类分割前后图像间的互信息,以基于对称分布多样性的粒子群算法为优化技术,构造了一种新的图像分割方法——基于互信息和类距离测度最优的图像聚类算法。对医学图像进行仿真,实验结果表明该算法得到的图像边界清晰连续,图像的内部特征保持完好,与多种聚类算法相比,图像分割的质量明显得到提高。  相似文献   

8.
在图像搜索的场景中,由于搜索请求的随机性,为了提高搜索速度,搜索算法运行时需要把整个数据集预先载入到运行内存.由于运行内存价格远高于同容量的硬盘价格,降低运行内存自然可以大大降低图像搜索服务的成本,但如果直接对数据进行压缩,往往会极大地损失搜索精度.在这种情况下,文中提出了一种基于图像内容特征的分块式图像搜索框架.先利...  相似文献   

9.
论述了基于代表色聚类的图像检索方法,采用Visual C#和SQL Server设计并实现了一个图像检索的原型系统,对研究CBIR及其应用具有一定的参考价值。  相似文献   

10.
层次聚类算法的改进及分析   总被引:2,自引:0,他引:2  
层次凝聚算法是一个非常有用的聚类算法,它在迭代地凝聚每次接近对直到所有的数据都属于同一个簇.但层次聚类也存在着几个缺点,如聚类时的时空复杂性高;聚类的簇效率低、误差较大等.经验研究表明,大部分HAC算法都有这样一个趋势:除了在谱系图的顶层,所有低层聚类的簇都是比较小的并且很接近于其他的簇,提出了一种改进算法能够减小时空复杂性并能验证其正确性,分析与实验都证明这种方法是非常有效的.  相似文献   

11.
目的 为了进一步提高噪声图像分割的抗噪性和准确性,提出一种结合类内距离和类间距离的改进可能聚类算法并将其应用于图像分割。方法 该算法避免了传统可能性聚类分割算法中仅仅考虑以样本点到聚类中心的距离作为算法的测度,将类内距离与类间距离相结合作为算法的新测度,即考虑了类内紧密程度又考虑了类间离散程度,以便对不同的聚类结构有较强的稳定性和更好的抗噪能力,并且将直方图融入可能模糊聚类分割算法中提出快速可能模糊聚类分割算法,使其对各种较复杂图像的分割具有即时性。结果 通过人工合成图像和实际遥感图像分割测试结果表明,本文改进可能聚类算法是有效的,其分割轮廓清晰,分类准确且噪声较小,其误分率相比其他算法至少降低了2个百分点,同时能获得更满意的分割效果。结论 针对模糊C-均值聚类分割算法和可能性聚类分割算法对于背景和目标颜色相近的图像分类不准确的缺陷,将类内距离与类间距离相结合作为算法的测度有效的解决了图像分割归类问题,并且结合直方图提出快速可能模糊聚类分割算法使其对于大篇幅复杂图像也具有适用性。  相似文献   

12.
CFSFDP是基于密度的新型聚类算法,可聚类非球形数据集,具有聚类速度快、实现简单等优点。然而该算法在指定全局密度阈值dc时未考虑数据空间分布特性,导致聚类质量下降,且无法对多密度峰值的数据集准确聚类。针对以上缺点,提出基于网格分区的CFSFDP(简称GbCFSFDP)聚类算法。该算法利用网格分区方法将数据集进行分区,并对各分区进行局部聚类,避免使用全局dc,然后进行子类合并,实现对数据密度与类间距分布不均匀及多密度峰值的数据集准确聚类。两个典型数据集的仿真实验表明,GbCFSFDP算法比CFSFDP算法具有更加精确的聚类效果。  相似文献   

13.
Web检索结果快速聚类方法的研究与实现   总被引:2,自引:0,他引:2  
为了帮助Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档,在对聚类过程研究分析的基础上给出了一种Web检索结果快速聚类方法。它通过分析聚类过程,从建立索引模型、相似性的计算到聚类结果的形成等环节,都做了分析和简化,并利用检索结果的标题、Url以及文档片断3部分所含信息计算返回结果之间的相似度,将首先返回的部分检索结果利用无向图映射法进行部分聚类后,将其余返回结果分配到与之最相近的集簇中最终形成聚类结果。该方法实现简单。实验证明该方法响应速度快,聚类相关性较高,空间占用少。  相似文献   

14.
提出了一种基于多层区域谱聚类的非监督SAR图像分割算法(multi-space and multi-hierarchical region based spectral clustering, MSMHSC)。该算法首先在特征与几何空间求距离, 快速获得初始过分割区域, 然后在过分割区域的谱空间上进行聚类, 最终实现非监督的SAR图像分割。该方法计算复杂度小, 无须训练样本, 使用层次化思想使其能更充分地利用SAR图像各类先验与似然信息。在MSTAR真实SAR数据集上的实验验证了该算法的快速性和有效性。  相似文献   

15.
P. Ferragina  A. Gulli 《Software》2008,38(2):189-225
We propose a (meta‐)search engine, called SnakeT (SNippet Aggregation for Knowledge ExtracTion), which queries more than 18 commodity search engines and offers two complementary views on their returned results. One is the classical flat‐ranked list, the other consists of a hierarchical organization of these results into folders created on‐the‐fly at query time and labeled with intelligible sentences that capture the themes of the results contained in them. Users can browse this hierarchy with various goals: knowledge extraction, query refinement and personalization of search results. In this novel form of personalization, the user is requested to interact with the hierarchy by selecting the folders whose labels (themes) best fit her query needs. SnakeT then personalizes on‐the‐fly the original ranked list by filtering out those results that do not belong to the selected folders. Consequently, this form of personalization is carried out by the users themselves and thus results fully adaptive, privacy preserving, scalable and non‐intrusive for the underlying search engines. We have extensively tested SnakeT and compared it against the best available Web‐snippet clustering engines. SnakeT is efficient and effective, and shows that a mutual reinforcement relationship between ranking and Web‐snippet clustering does exist. In fact, the better the ranking of the underlying search engines, the more relevant the results from which SnakeT distills the hierarchy of labeled folders, and hence the more useful this hierarchy is to the user. Vice versa, the more intelligible the folder hierarchy, the more effective the personalization offered by SnakeT on the ranking of the query results. Copyright © 2007 John Wiley & Sons, Ltd.  相似文献   

16.
For data sets of arbitrary shapes and densities,the existing clusterings have much space to be improved to obtain better results.In this paper,clustering is considered as a cognitive problem,and cognitive features are of vital importance to clustering.In combination with psychological experiment,we propose three cognitive features of clustering and model them as a flexible similarity measurement.Meanwhile a new clustering framework is put forward to integrate the cognitive features by employing the similarity measurement.The two attractive advantages are its low complexity and fitness for various types of data sets,such as data sets of diferent shapes and densities.Some synthetic and real data sets are employed to exhibit the superiority of the new clustering algorithm.  相似文献   

17.
结合关联规则的元搜索引擎结果聚类改进   总被引:2,自引:1,他引:1  
将目的搜索引擎返回的结果经分词处理并提取主要关键词后,采用关联规则建立关联词矩阵,并利用FCM(Fuzzy C-Means,模糊C均值聚类)对结果进行聚类,且通过聚类有效性函数FPU,c)判断最佳聚类结果,最终按照相关度大小顺序将结果返回。通过与K-means(K均值聚类)算法的实验对比发现,以上方法能有效地保证运行效率与聚类个数的有效性,且提高了相关结果的排序位置,因此更能满足用户的需求。  相似文献   

18.
吴崇数  林霖  薛蕴菁  时鹏 《计算机应用》2020,40(6):1856-1862
在苏木精-伊红(HE)染色病理图像中,细胞染色分布的不均匀和各类组织形态的多样性给病理图像的自动分割带来极大挑战。为解决该问题,提出了一种基于自监督学习的病理图像三步层次分割方法,对病理图像中各类组织进行由粗略到精细的全自动逐层分割。首先,根据互信息的计算结果在RGB色彩空间中进行特征选择;其次,采用K-means聚类将图像初步分割为各类组织结构的色彩稳定区域与模糊区域;然后,以色彩稳定区域为训练集采用朴素贝叶斯分类对模糊区域进行进一步分割,得到完整的细胞核、细胞质和胞外间隙这三类组织结构;最后,对细胞核部分进行结合形状和色彩强度的混合分水岭分割得到细胞核间的精确边界,进而量化计算细胞核个数、核占比、核质比等指标。对脑膜瘤HE染色病理图像的分割实验结果表明,所提方法对于染色和细胞形态差异保持较高的鲁棒性,各类组织区域分割误差在5%以内,在细胞核分割精度的对比实验中平均正确率在96%以上,满足临床自动图像分析的要求,其量化结果可以为定量病理分析提供依据。  相似文献   

19.
首先总结了链接挖掘中基于属性—链接聚类算法的研究现状;然后把它大体分为三类,对每一类中具有代表性的算法进行了详细介绍、分析和评价;最后指出了该领域进一步的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号