首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
目前,大多数聚类方法是二支聚类,即对象要么属于一个类,要么不属于一个类,聚类的结果必须具有清晰的边界。然而,将某些不确定的对象强制分配到某个类中将降低聚类结果的结构和精度。三支聚类是一种重叠聚类,它采用核心域和边界域来表示每个类别,较好地处理了具有不确定性对象的聚类问题。提出了一种使用样本邻域将二支聚类转化为三支聚类的方法。该方法利用二支聚类的结果和每个类中元素的邻域是否完全包含在该类中来对集合进行收缩,同时利用不在该类中的元素的邻域是否与该类有交集来进行扩张。收缩的区域称为核心域,扩张域和核心域的差集称为边界域。在UCI数据集上的实验结果显示,该方法在提高聚类结果的结构和F1值方面有较好的效果。  相似文献   

2.
传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数目最多的聚类中选择离散量最大与最小的两个对象作为初始聚类中心,再根据最近距离将这个大聚类中的其他对象划分到与之最近的初始聚类中,直到聚类个数等于指定的k值。最后将这k个聚类作为初始聚类应用到k-means算法中。将提出的算法与传统k-means算法、最大最小距离聚类算法应用到多个数据集进行实验。实验结果表明,改进后的k-means算法选取的初始聚类中心唯一,聚类过程的迭代次数也减少了,聚类结果稳定且准确率较高。  相似文献   

3.
地理信息系统存储了大量的二维空间对象,对这些对象进行聚类分析是数据挖掘的一项重要任务.本文提出一种针对二维空间对象的聚类算法.该算法引用层次聚类方法的思想,将子聚类信息用一个聚类特征表示.采用基于密度的方法,发现任意形状的簇,能较好地处理孤立点,并且支持增量式聚类.实验证明该算法是有效的.  相似文献   

4.
快速发现任意形状的聚类   总被引:2,自引:0,他引:2  
提出FFCAS(Fast Finding the Clusters of Arbitrary Shape)聚类算法,用于快速发现任意形状的聚类,先将每个对象分配到很小的ε-邻域,即原子聚类,然后找出高浓度的核心原子聚类,再消除所有的冗余原子聚类,仅用边界来表示聚类,大大减小了存储空间。因为ε是一个很小的值,原子聚类能自然地描述聚类。该算法最坏时间复杂度为O(n log n)(n为数据库中的对象个数),只需访问一次数据库,实验表明,FFCAS运行时间与数据库中的对象数目成线性关系,能发现任意形状的聚类,对异类的敏感性低,对大型、高维数据库也有效。  相似文献   

5.
基于模糊聚类的文本挖掘算法   总被引:8,自引:3,他引:5       下载免费PDF全文
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用干文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。  相似文献   

6.
对谱聚类的奇异解进行了研究。在谱聚类中,由对象相似度的定义,两种属性完全不同或截然相反的对象的类,其类内对象的相似度、类间对象的相似度和与其它类对象的相似度,会出现接近或相同的情况,从而有可能被聚为一类。研究发现,大多数情况下,出现谱聚类的奇异解的主要原因是聚类个数设置不合理和高斯核参数σ估计不准确。本文给出了利用特征值差值分析与特征值累积贡献率来确定聚类个数和估计高斯核参数σ的方法。实验表明,所给聚类个数选择和高斯核参数σ估计的方法有效,可以消除谱聚类结果中存在的奇异解。  相似文献   

7.
聚类作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。提出的基于交集的聚类组合新方法,借鉴了选举投票的思想。给定同一数据集的不同聚类结果,此算法先求出不同聚类结果中每个簇的对应关系,然后计算这几个聚类结果对应簇的交集,对剩余的有争议对象进行投票,最后把投票之后仍未确定归属的对象分配给最近对象所在的簇,或者不经过投票直接将有争议的对象分配给最近对象所在的簇。实验表明,两种方法都能明显改善聚类质量,投票后得到的结果要略优于不投票的结果。  相似文献   

8.
沈洁  林颖  陈志敏  赵敏涯 《计算机应用》2005,25(7):1654-1657
提出一种新的用户访问模式增量式聚类算法:首先引入一种新的用户兴趣表示方法构造用户访问特征对象,再基于蚁群聚类的基本思想,利用人工蚂蚁依相邻区域对象相似性拾起或放下对象实现聚类;然后使用一种类解体机制,随着用户兴趣度的变化而形成新的类别,从而实现增量式聚类更新发现用户新的访问兴趣。实验结果表明,该方法能动态有效地实现增量式聚类。  相似文献   

9.
《软件》2019,(11)
本文对于意见挖掘领域中的评价对象的修剪和聚类问题,提出使用K-means聚类算法和BIRCH聚类算法相结合的方式来进行评价对象的修剪和聚类。利用BIRCH算法类别聚类的功能对评价对象进行聚类,并删除包含较少数据的簇来实现修剪评价对象;再通过对于剩下的簇使用K-means聚类算法来获得最优评价对象。这种修剪聚类方法与以往的基于PMI算法修剪然后基于K-means聚类算法相比,减少了评价对象修剪时对语料库的依赖,最终聚类的结果更加精准,而且BIRCH算法采用一次扫描数据库的策略,可以有效提高速度。  相似文献   

10.
提出了一种基于核聚类的H.264压缩域的运动对象分割的方法。首先对运动矢量进行归一化处理,其次用引入了平均欧式距离的中值滤波的方法对运动矢量进行滤波去噪,再次利用减法聚类初始化聚类中心并且使用引入了核函数的模糊聚类进行聚类,最后将有效函数的判断结果作为分割条件,从而达到自适应分割出压缩域中的运动对象的目的。本方法对Hall视频序列进行了实验,实验证明,通过该方法可以获得较好的分割出视频序列中的运动对象。  相似文献   

11.
基于目标的图像标注一直是图像处理和计算机视觉领域中一个重要的研究问题.图像目标的多尺度性、多形变性使得图像标注十分困难.目标分割和目标识别是目标图像标注任务中两大关键问题.本文提出一种基于形式概念分析(Formal concept analysis, FCA)和语义关联规则的目标图像标注方法, 针对目标建议算法生成图像块中存在的高度重叠问题, 借鉴形式概念分析中概念格的思想, 按照图像块的共性将其归成几个图像簇挖掘图像类别模式, 利用类别概率分布判决和平坦度判决分别去除目标噪声块和背景噪声块, 最终得到目标语义簇; 针对语义目标判别问题, 首先对有效图像簇进行特征融合形成共性特征描述, 通过分类器进行类别判决, 生成初始目标图像标注, 然后利用图像语义标注词挖掘语义关联规则, 进行图像标注的语义补充, 以避免挖掘类别模式时丢失较小的语义目标.实验表明, 本文提出的图像标注算法既能保证语义标注的准确性, 又能保证语义标注的完整性, 具有较好的图像标注性能.  相似文献   

12.
基于帧间差分法的动体特征速度聚类分析   总被引:1,自引:0,他引:1  
针对智能视频监控中快速、准确的检测和识别运动物体的问题,提出了一种依据运动物体特征速度来检测识别动体以及解读其语义含义的算法。该方法以相对帧间差分法为基础,通过对预处理后的二值斑块图像的标记,计算斑块的像素长度作为其特征速度,并依据斑块特征速度的众数进行聚类分析,从斑块特征速度得到运动物体的特征速度语义解读和运动物体的检测识别。实验结果表明,斑块的特征速度不仅可以实现对运动物体的检测,而且通过聚类分析可以准确的得出动体特征的语义解读。用特征速度和众数聚类分析方法实现对运动物体的检测识别和语义解读相对于其他统计算法简单有效,便于智能摄像机的嵌入式开发。  相似文献   

13.
概念的语义相似度计算是自然语言处理等领域的重要研究内容,基于语义距离的概念相似度计算是其主要方法。在分析现有算法存在弊端的基础上,提出基于领域本体群组划分的概念语义距离计算方法。首先给出多概念群组下概念语义距离的计算规则,然后分别提出群组内和群组间的概念语义距离计算方法,通过引入正向和反向的语义距离来解决上下位关系概念对的语义相似度非对称性,并通过概念节点的位置动态分配关系的权值来处理其他非上下位的二元关系。实验表明,基于领域本体群组划分的概念语义距离计算方法是有效的,与其他典型的同类方法相比,具有明显的优势。  相似文献   

14.
This paper presents the colored farthest-neighbor graph (CFNG), a new method for finding clusters of similar objects. The method is useful because it works for both objects with coordinates and for objects without coordinates. The only requirement is that the distance between any two objects be computable. In other words, the objects must belong to a metric space. The CFNG uses graph coloring to improve on an existing technique by Rovetta and Masulli. Just as with their technique, it uses recursive partitioning to build a hierarchy of clusters. In recursive partitioning, clusters are sometimes split prematurely, and one of the contributions of this paper is a way to reduce the occurrence of such premature splits, which also result when other partition methods are used to find clusters.  相似文献   

15.
基于变异系数的边界点检测算法   总被引:2,自引:0,他引:2  
为有效检测聚类的边界点,提出基于变异系数的边界点检测算法.首先计算出数据对象到它的k-距离邻居距离之和的平均值.然后用平均值的倒数作为每个点的密度,通过变异系数刻画数据对象密度分布特征寻找边界点.实验结果表明,该算法可在含有任意形状、不同大小和不同密度的数据集上快速有效检测出聚类的边界点,并可消除噪声.  相似文献   

16.
The EM algorithm is used to track moving objects as clusters of pixels significantly different from the corresponding pixels in a reference image. The underlying cluster model is Gaussian in image space, but not in grey-level difference distribution. The generative model is used to derive criteria for the elimination and merging of clusters, while simple heuristics are used for the initialisation and splitting of clusters. The system is competitive with other tracking algorithms based on image differencing.  相似文献   

17.
提出SkyCluster的概念,对skyline对象进行基于密度的聚类.另一方面,由于skyline查询和聚类处理均是CPU-敏感的.因此,为了提高获取SkyCluster的效率,提出一种有效聚类skyline对象集的方法EAPSC.EAPSC算法基于文章给出的SLT索引树,并利用SLT索引树的多个有效性质来快速产生所有的SkyCluster聚类.理论分析和实验结果表明,该方法具有有效性和实用性.  相似文献   

18.
Cluster validity indices are used for estimating the quality of partitions produced by clustering algorithms and for determining the number of clusters in data. Cluster validation is difficult task, because for the same data set more partitions exists regarding the level of details that fit natural groupings of a given data set. Even though several cluster validity indices exist, they are inefficient when clusters widely differ in density or size. We propose a clustering validity index that addresses these issues. It is based on compactness and overlap measures. The overlap measure, which indicates the degree of overlap between fuzzy clusters, is obtained by calculating the overlap rate of all data objects that belong strongly enough to two or more clusters. The compactness measure, which indicates the degree of similarity of data objects in a cluster, is calculated from membership values of data objects that are strongly enough associated to one cluster. We propose ratio and summation type of index using the same compactness and overlap measures. The maximal value of index denotes the optimal fuzzy partition that is expected to have a high compactness and a low degree of overlap among clusters. Testing many well-known previously formulated and proposed indices on well-known data sets showed the superior reliability and effectiveness of the proposed index in comparison to other indices especially when evaluating partitions with clusters that widely differ in size or density.  相似文献   

19.
A Novel Approach Towards Large Scale Cross-Media Retrieval   总被引:1,自引:1,他引:0       下载免费PDF全文
With the rapid development of Internet and multimedia technology,cross-media retrieval is concerned to retrieve all the related media objects with multi-modality by submitting a query media object.Unfortunately,the complexity and the heterogeneity of multi-modality have posed the following two major challenges for cross-media retrieval:1) how to construct a unified and compact model for media objects with multi-modality,2) how to improve the performance of retrieval for large scale cross-media database.In this paper,we propose a novel method which is dedicate to solving these issues to achieve effective and accurate cross-media retrieval.Firstly,a multi-modality semantic relationship graph(MSRG) is constructed using the semantic correlation amongst the media objects with multi-modality.Secondly,all the media objects in MSRG are mapped onto an isomorphic semantic space.Further,an efficient indexing MK-tree based on heterogeneous data distribution is proposed to manage the media objects within the semantic space and improve the performance of cross-media retrieval.Extensive experiments on real large scale cross-media datasets indicate that our proposal dramatically improves the accuracy and efficiency of cross-media retrieval,outperforming the existing methods significantly.  相似文献   

20.
张华迪 《计算机应用研究》2020,37(12):3811-3814,3819
针对目前协同显著性检测方法中存在的语义特征类相差悬殊的物体被误检测为协同对象等问题,提出了一种基于卷积神经网络和语义相关的协同显著性检测算法CSCCD。首先,采用引导超像素滤波方法对SLIC分割出的超像素区域和DSS生成的显著性区域进行处理,清晰地显示了目标边界轮廓;然后使用Mask R-CNN提取语义特征,给出了图像语义特征和语义一致性的定义,并针对提取语义特征过程中出现的同一语义类别的物体在不同形态下被检测为不同语义类别的问题,提出了图像组语义相关类的概念,在此概念的基础上定义了图像组语义关联类,解决了多幅图像的语义关联问题;最后融合显著性检测区域和图像组语义一致性区域得到协同显著性检测结果。在公开基准数据集上的实验结果表明,该算法能够有效凸显目标整体及轮廓,在客观量化方面的综合性能有明显提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号