首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
多尺度聚类挖掘算法   总被引:3,自引:1,他引:2  
数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先,根据概念分层理论扩展尺度定义并构建多尺度数据集;其次,阐述尺度转换原因、分类,归纳多尺度聚类的定义;然后,以克里格法为理论基础,给出多尺度聚类尺度上推算法MSCSUA和多尺度聚类尺度下推算法MSCSDA;最后,利用公用UCI聚类数据集和H省全员人口真实数据集对算法进行实验验证,结果表明MSCSUA和MSCSDA是有效、可行的。  相似文献   

2.
多尺度聚类挖掘在指导人们进行多尺度决策方面有着不可取代的作用,然而传统的多尺度聚类挖掘算法有一个致命的弱点,即需要在每个用户感兴趣的尺度上应用聚类挖掘算法.为克服此缺陷,定义了一种将数据的多尺度特性进行向量化的方法;结合地学领域的尺度转换机制,提出了一种新的知识的多尺度转换机制——基于加权向量提升的多尺度聚类挖掘算法WVB-MSCA(Weight Vector Based Multi-scale Clustering Algorithm).算法首先在选定的基准尺度上进行聚类挖掘,获取聚类结果,并借助尺度转换机制将基准尺度的聚类结果反演到其它感兴趣的尺度上.实验表明,算法WVB-MSCA是可行且有效的.  相似文献   

3.
为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链的尺度上推和基于Lanczos核的尺度下推尺度转换算法;最后,利用公用数据集以及H省真实数据集进行实验验证。将耦合度量相似性(Couple metric similarity, CMS)、逆发生频率(Inverse occurrence frequency, IOF)、汉明距离(Hamming distance, HM)等方法与谱聚类结合作为对比算法,结果表明,尺度上推算法与对比算法相比,NMI值平均提高13.1%,MSE值平均减小0.827,F-score值平均提高12.8%;尺度下推算法NMI值平均提高19.2%,MSE值平均减小0.028,F-score值平均提高15.5%。实验结果表明,所提出的算法具有有效性和可行性。  相似文献   

4.
多尺度数据挖掘方法   总被引:4,自引:0,他引:4  
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的.  相似文献   

5.
针对真实场景图像的目标分类问题,提出一种基于多尺度上下文信息的分类算法.首先运用一种软判决采样机制对图像进行局部信息采样,使场景内混合的各类信息以一种鲁棒的方式得到有效分离;然后,进一步基于软判决采样和统计特征表达机制,计算各空间尺度下的目标上下文统计特征;最后,通过逻辑回归分类算法有效地融合多尺度的上下文信息,并作出分类决策.实验表明,所提出的算法能更好地刻画真实场景下目标的特性,明显提高图像目标分类性能.  相似文献   

6.
提出对装备维修案例进行收集整理加工,利用多层分类算法,对维修案例进行分类,方便查询与检索,并为故障推理提供规则挖掘的来源。  相似文献   

7.
目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但 还没有研究涉及 一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。  相似文献   

8.
针对传统点云分类网络难以充分发挥卷积神经网络优势的问题,提出一种多尺度点云分类网络MSP-Net.首先,基于局部区域划分的完备性、自适应性、重叠性及多尺度特性要求,提出了多尺度局部区域划分算法,并以点云及不同层次的特征为输入,得到多尺度局部区域;然后构建了包含单尺度特征提取、低层次特征聚合及多尺度特征融合等模块的多尺度点云分类网络.该网络充分地模拟了卷积神经网络的作用原理,具备随着网络尺度和深度的增加,局部感受野越来越大,特征抽象程度越来越高的基本特征.最后将该算法应用在标准公开数据集ModelNet10和ModelNet40上,分别取得了94.71%和91.73%的分类准确率,表明该算法在同类工作中处于领先或相当的水平,验证了算法思想的可行性及有效性.  相似文献   

9.
为提高分类精度,提出一种基于最大期望(EM)与遗传(GA)算法的多尺度SAR图像无监督分类方法.利用多尺度自回归(MAR)模型描述SAR图像中不同尺度之间的统计相依性,提取多尺度特征.应用混合模型描述多尺度特征,并将GA算法与EM算法相结合给出混合模型的参数估计算法,利用最小描述长度(MDL)准则选择模型的分量教.最后使用Bayes分类器实现了图像的分类与分割.该方法集EM算法和GA算法结合后的优点,对设定初值有较少的敏感性,因而避免了局部最优解.应用于SAP图像的实验表明,在分割精度上GA-EM方法优于MAR模型的算法.  相似文献   

10.
基于多尺度LBP金字塔特征的分类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
为有效解决旋转变化、光照变化和尺度变化等图像的分类问题,提出一种基于多尺度局部二元模式(LBP)金字塔特征的图像分类算法。通过多尺度LBP金字塔提取各尺度的图像纹理特征,建立图像的多尺度LBP金字塔直方图,并将其作为图像特征向量,采用K-means方法对该特征向量进行降维,以用于图像分类。同时,针对传统二进制权值分布方法对噪声敏感的缺点,提出一种多端权值分布方法。实验结果表明,多尺度LBP金字塔方法具有较好的可鉴别性及图像描述能力,而多端权值分布法也能提高图像的分类精度。  相似文献   

11.
多尺度数据挖掘多应用于空间遥感图像数据,以图像的分辨率或者区域分割为依据进行尺度划分,然后在每个尺度层进行分析。近期,有不少学者将多尺度数据挖掘应用于一般数据集上,以等级理论、概念分层和包含度理论尺度划分等为尺度划分依据,研究不同尺度层的分布规律,进而发现有意义的事实,如多尺度关联规则以及多尺度聚类。但是在一般数据集下,很少将多尺度数据挖掘应用于分类算法领域。本文定义了广义分形插值理论的概念,打破了局限于迭代函数系统IFS(Iterative Function Systems)的缺憾,拓展了分形插值的应用;提出了基于广义分形插值理论的多尺度分类尺度下推算法MSCSDA(Multi-Scale Classification Scaling-Down Algorithm);仿真实验建立在4个UCI基准数据集和1个H省部分人口真实数据集上,并将MSCSDA与KNN、Decision Tree以及Libsvm算法进行对比分析;实验结果表明,MSCSDA算法在不同的数据集上,均优于其他算法。  相似文献   

12.
史静  朱虹  王栋  杜森 《中国图象图形学报》2017,22(12):1750-1757
目的 目前对于场景分类问题,由于其内部结构的多样性和复杂性,以及光照和拍摄角度的影响,现有算法大多通过单纯提取特征进行建模,并没有考虑场景图像中事物之间的相互关联,因此,仍然不能达到一个理想的分类效果。本文针对场景分类中存在的重点和难点问题,充分考虑人眼的视觉感知特性,利用显著性检测,并结合传统的视觉词袋模型,提出了一种融合视觉感知特性的场景分类算法。方法 首先,对图像进行多尺度分解,并提取各尺度下的图像特征,接着,检测各尺度下图像的视觉显著区域,最后,将显著区域信息与多尺度特征进行有机融合,构成多尺度融合窗选加权SIFT特征(WSSIFT),对场景进行分类。结果 为了验证本文算法的有效性,该算法在3个标准数据集SE、LS以及IS上进行测试,并与不同方法进行比较,分类准确率提高了约3%~17%。结论 本文提出的融合视觉感知特性的场景分类算法,有效地改善了单纯特征描述的局限性,并提高了图像的整体表达。实验结果表明,该算法对于多个数据集都具有较好的分类效果,适用于场景分析、理解、分类等机器视觉领域。  相似文献   

13.
针对现有关联分类技术的不足,提出了一种适用于关联分类的增量更新算法IUAC。该算法是基于频繁模式树挖掘和更新关联规则的,并使用一种树形结构来存储最终用于分类的关联规则。同时,增加了对分类规则的约束条件,进一步控制了用于分类的关联规则的数量。最后,对算法整体进行了分析和讨论。  相似文献   

14.
针对图割曲面重建算法计算量过大的难题, 根据代数多栅理论对图割计算过程进行多尺度分解, 仅对最后一级进行最大流计算, 其他级的标记值通过插值得到。首先, 根据点云法向和重建曲面法向的一致性构建能量函数; 其次, 将能量函数映射到三维权重图的顶点和边上; 然后, 定义顶点间的一致性并由此构造抽取矩阵, 以决定哪些图的顶点参与图割运算; 之后, 构造插值矩阵, 将最后一级图割计算结果逐级插值到第一级; 最后, 利用步进立方体算法得到重建曲面的三角网格表示。实验结果表明, 与窄带图割算法相比, 本方法计算速度更快, 当图的顶点数越多时速度提高得越多; 对于不均匀采样的点云数据, 重建效果更好; 其他情况下两者效果相当。  相似文献   

15.
由于实际景象地物特征复杂,单一尺度边缘检测算子提取的边缘与噪声点测度差异小,因此将导致细小地物与噪声相互掺杂,边缘提取不准确的现象。针对此问题,提出了一种基于冲突再分配DSmT的多尺度融合边缘检测算法。首先提取图像多尺度边缘测度,接着提出双向指数映射基本置信指派构造方法构造多尺度边缘测度基本置信指派,然后采用冲突再分配DSmT组合规则对多尺度边缘置信指派进行融合,最后根据融合后的边缘置信指派图通过双阈值法确定边缘像素。通过对可见光和合成孔径雷达(SAR)图像的仿真实验表明,该算法相比单一尺度的Canny算子在边缘提取过程减小了误检和漏检边缘点数目,在抑制噪声的同时,大量保留了景象细节信息。  相似文献   

16.
基于贝叶斯方法的决策树分类算法   总被引:6,自引:0,他引:6  
樊建聪  张问银  梁永全 《计算机应用》2005,25(12):2882-2884
针对数据挖掘的特点和本质,充分利用贝叶斯方法和决策树分类的优点,将贝叶斯的先验信息方法与决策树分类的信息增益方法相结合,提出了一种新的数据挖掘分类算法(BD1.0算法),并对此算法进行了设计和分析。实验分析表明,该算法可以处理不一致或者不完整数据等“脏数据”,比单纯使用贝叶斯方法或决策树方法具有更高的准确率,而且与C4.5算法具有近似的时间复杂度。  相似文献   

17.
提出一种基于密度中心图的弱监督分类方法,利用少量已标注样本,结合大量未知模式样本进行弱监督学习。借助样本空间的密度信息,求出密度中心点来准确地反应数据的空间几何特征,在此基础上建图,利用标记传递方法,使得相似的顶点尽可能赋予相同的类别标记。该方法具备基于图的弱监督算法的良好数学基础,可以发现任意形状的类,对噪音不敏感。并且该方法具有近线性的时间复杂度,更适合处理大规模的数据。将该方法用于UCI机器学习数据集,实验证明,该方法能获得较好的分类效果。  相似文献   

18.
提出一种改进的数据挖掘算法。首先采用ICTCLAS系统进行文本预处理,以词频特征构建词条向量;然后融合词频特征和词频-逆向文件频率特征,构建训练样本集的特征矩阵;接着对该矩阵进行奇异值分解变换,得到语义空间,用于对文本特征向量进行语义空间变换,得到语义向量;最后构建联合支持向量机分类器,实现中文书目所对应的语义向量的自动分类。最后做了大量的仿真实验,实验结果表明,本文方法的分类准确率高于现有方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号