首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
多尺度聚类挖掘算法   总被引:3,自引:1,他引:2  
数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先,根据概念分层理论扩展尺度定义并构建多尺度数据集;其次,阐述尺度转换原因、分类,归纳多尺度聚类的定义;然后,以克里格法为理论基础,给出多尺度聚类尺度上推算法MSCSUA和多尺度聚类尺度下推算法MSCSDA;最后,利用公用UCI聚类数据集和H省全员人口真实数据集对算法进行实验验证,结果表明MSCSUA和MSCSDA是有效、可行的。  相似文献   

2.
多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角度分析,实现一次挖掘,多次应用。首先,介绍粒计算相关知识;然后,提出多尺度聚类尺度上推算法UAMC(Upscaling Algorithm of Multi-scale Clustering),以簇为粒子,簇心为粒子特征进行尺度转换,利用斑块模型得到大尺度知识,避免二次挖掘带来的资源浪费;最后,利用UCI公用数据集和H省全员人口真实数据集对算法性能进行实验验证,结果表明算法在准确性上优于K-Means等基准算法,是有效可行的。  相似文献   

3.
多尺度的谱聚类算法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出了一种多尺度的谱聚类算法。与传统谱聚类算法不同,多尺度谱聚类算法用改进的k-means算法对未经规范的Laplacian矩阵的特征向量进行聚类。与传统k-means算法不同,改进的k-means算法提出一种新颖的划分数据点到聚类中心的方法,通过比较聚类中心与原点的距离和引入尺度参数来计算数据点与聚类中心的距离。实验表明,改进算法在人工数据集上取得令人满意的结果,在真实数据集上聚类结果较优。  相似文献   

4.
为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链的尺度上推和基于Lanczos核的尺度下推尺度转换算法;最后,利用公用数据集以及H省真实数据集进行实验验证。将耦合度量相似性(Couple metric similarity, CMS)、逆发生频率(Inverse occurrence frequency, IOF)、汉明距离(Hamming distance, HM)等方法与谱聚类结合作为对比算法,结果表明,尺度上推算法与对比算法相比,NMI值平均提高13.1%,MSE值平均减小0.827,F-score值平均提高12.8%;尺度下推算法NMI值平均提高19.2%,MSE值平均减小0.028,F-score值平均提高15.5%。实验结果表明,所提出的算法具有有效性和可行性。  相似文献   

5.
靶场测量中的连发弹目标数量较多,需要对此目标进行分类跟踪,文章提出了一种多尺度多级模糊聚类的分类算法,首先对靶场测量中的多连发目标的特性进行分析,定义了3种不同的类目标群序列,其次针对模糊聚类算法必须先验确定聚类初始点以及聚类中心的缺陷,在此基础上加入尺度因子,并根据目标群的位置信息以及运动方向信息进行多级聚类,最后通过多次聚类实验证明分类结果能够满足靶场测量中的多连发目标的分类要求.  相似文献   

6.
为降低厂家因瓶装酒瑕疵带来的不必要损失,提出一种改进的Cascade R-CNN算法模型,对酒瓶瑕疵进行检测.采用基于聚类算法的Anchor生成策略,将多尺度预测的骨干网络用作特征提取,使用感兴趣对齐层取代原先的感兴趣池化层.将改进的模型与其它基于Faster R-CNN和Cascade R-CNN的酒瓶瑕疵检测模型做...  相似文献   

7.
多视图子空间聚类方法因其可以揭示数据内在的低维结构而被广泛关注,但大多数现有的多视图子空间聚类算法直接将多个来自原始数据的充满噪声的相似度矩阵进行融合,并且通常是在得到一致的多视图表示之后再使用K均值算法聚类得到最终的结果,这种将表示的学习过程和后续的聚类过程分离的两阶段算法会导致无法得到最优的聚类结果.为了解决这些问题,提出一种单步划分融合多视图子空间聚类算法.该算法不是直接融合具有噪声和冗余信息的相似度矩阵,而是从相似度矩阵中提取出更具有判别性信息的划分级信息进行融合.提出一个新的框架,将表示学习、多视图信息融合以及最后的聚类过程整合在同一框架中.这三个过程彼此促进,好的聚类结果可以引导生成更好的多视图表示,从而得到更好的聚类效果.提出一种有效的轮替优化算法来解决由此得到的优化问题.最后,在四个真实的基准数据集上得到的实验结果可以证明提出方法的有效性以及先进性.  相似文献   

8.
传统谱聚类算法受高斯核尺度参数的影响较大,对噪声点较为敏感,并且不能利用先验信息指导聚类过程。针对以上问题,提出了一种基于路径相似度测量的鲁棒性谱聚类算法(RPB-SC)。该算法将路径聚类与谱聚类算法相结合,通过定义高斯核的邻域加权尺度因子计算相似度,再用路径聚类思想对全局相似度进行调节,同时通过成对限制先验信息辅助聚类搜索。在人工数据集和真实数据集上的实验表明,新提出的算法能有效减弱高斯核尺度参数的影响,增强对噪声点的鲁棒性,提高聚类性能。  相似文献   

9.
针对传统多分辨率模糊聚类图像分割算法的不足,提出了将二型模糊应用于多分辨率模糊聚类图像分割的新方法.将最粗尺度图像的聚类中心作为下一较细分辨率图像的初始聚类中心,并采用较粗分辨率图像聚类的类内最大距离对细分辨率图像的模糊聚类目标函数进行约束.对较小的粗分辨率图像进行了模糊隶属度扩展,得到一组隶属度值,再采用二型模糊算法有效融合该隶属度集合,完成聚类分割.实验结果表明,该算法能有效实现目标区域分离,获得理想分割效果.  相似文献   

10.
陈俊芬  张明  何强 《计算机科学》2018,45(Z11):474-479
基于图论理论的NJW谱聚类算法的核心思想是将数据点映射到特征空间后再利用K-means算法进行聚类,从而得到原始数据的聚类结果。NJW算法是K-means算法的推广,并且在任意形状的数据上都具有较好的聚类效果,从而有着广泛的应用。但是,类数C和高斯核函数中的尺度参数σ较大程度地影响着NJW的聚类性能;另外,K-means对随机初始值的敏感性也影响着NJW的聚类结果。为此,一种基于启发式确定类数的谱聚类算法(记为DP-NJW)被提出。该算法先根据数据的密度分布确定类中心点和类数,这些类中心点作为特征空间中K-means聚类的初始类中心,然后用NJW进行聚类。文中通过实验将DP-NJW算法和经典聚类算法在7个公共数据集上进行测试和对比,其中DP-NJW算法在5个数据集上的聚类精度高于NJW的平均聚类精度,在另2个数据集上二者持平。对比DPC算法,所提算法在5个数据集上也有不俗的聚类精度,而且DP-NJW的计算消耗较小,在较大的数据集aggregation上表现更为突出。实验结果表明,文中所提的DP-NJW算法更具优势。  相似文献   

11.
目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但 还没有研究涉及 一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。  相似文献   

12.
In clustering algorithms, it is usually assumed that the number of clusters is known or given. In the absence of such a priori information, a procedure is needed to find an appropriate number of clusters. This paper presents a clustering algorithm that incorporates a mechanism for finding the appropriate number of clusters as well as the locations of cluster prototypes. This algorithm, called multi-scale clustering, is based on scale-space theory by considering that any prominent data structure ought to survive over many scales. The number of clusters as well as the locations of cluster prototypes are found in an objective manner by defining and using lifetime and drift speed clustering criteria. The outcome of this algorithm does not depend on the initial prototype locations that affect the outcome of many clustering algorithms. As an application of this algorithm, it is used to enhance the Hough transform technique.  相似文献   

13.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。  相似文献   

14.
在计算机视觉领域,尺度空间扮演着一个很重要的角色。多尺度图像分析的基础是自动尺度选择,但它 的性能非常主观和依赖于经验。基于互信息的度量准则,文章提出了一种自动选取最优尺度的模型。首先,研究 专注于基于形态学算子的多尺度图像平滑去噪方法,这种技术不需要噪声方差的先验知识,可以有效地消除照度 的变化。其次,通过递归修剪 Huffman 编码树,设计了一个基于聚类的无监督图像分割算法。一个特定的聚类数 从信息理论的角度来看,提出的聚类算法可以保留最大的信息量。最后,用一系列的实验对算法的性能进行了验证, 并从数学上进行了详细的证明和分析,实验结果表明本文提出的算法能获得最优尺度的图像平滑和分割性能 。  相似文献   

15.
子空间聚类算法只能处理小规模数据,且无法处理样本外数据.针对此问题,文中提出采用二次采样策略的子空间聚类框架(TSSC).该框架由两个核心部件组成:判别性协作表示(DCR)与多尺度K近邻(KNN)采样方法.在TSSC中,DCR首先结合多尺度KNN对数据点进行特征变换,从而保证属于同一子空间的点有更一致的表示.为了提高算法的可扩展性,TSSC在新的特征空间中使用多尺度KNN对数据进行二次采样,并根据采样点获得的初步聚类结果训练线性分类器,最后根据学习得到的分类器对剩余样本点进行分类,获得最终的聚类结果.在真实数据集上的实验验证TSSC的有效性.  相似文献   

16.
针对广义多尺度决策系统的知识表示与知识获取问题,讨论广义多尺度决策系统中基于对偶概率粗糙集模型的最优尺度组合选择问题.定义广义多尺度决策系统中β下近似最优尺度组合、 β上近似最优尺度组合、 β信任分布最优尺度组合与β似然分布最优尺度组合概念,分析不同最优尺度组合之间的关系与特征,证明当β在特殊的阈值范围内时, β下近似最优尺度组合与最大分布最优尺度组合等价,而β上近似最优尺度组合与广义决策最优尺度组合等价.  相似文献   

17.
首先给出标记背景的定义,在多标记背景下提出标记规则的概念,讨论标记规则的一些性质.然后在多标记背景的基础上,引入决策标记得到多标记决策背景,进一步探讨标记规则之间的冗余问题.再通过粒标记规则定义多标记决策背景的协调性,提出在保持协调性的前提下选择最优标记的方法.最后通过数值实验说明文中算法的有效性.  相似文献   

18.
针对不协调广义多尺度决策系统中每个对象事例的知识获取问题,文中提出局部最优尺度组合概念.首先,介绍广义多尺度决策系统中的尺度组合概念,给出在不同尺度组合下信息粒的表示及其相互关系.然后,在广义多尺度决策系统中,介绍不同尺度组合下集合的下近似与上近似概念及性质.最后,在不协调广义多尺度决策系统中定义7种局部最优尺度组合的概念,给出它们之间的相互关系,证明实际上只有5种不同的局部最优尺度组合概念.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号