首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
传统的聚类分析方法需要完全数据集,但有些情况下数据是不完全的,即包含缺失数据,这给聚类分析带来了一定的困难.作者给出了一种迭代算法为缺失数据确定一个合理的替补值,构造出一个“完全”的数据集,逐步迭代进行聚类分析,并用实例详细阐述了该方法的步骤.  相似文献   

2.
针对电力工程数据完整性分析困难的问题,提出了一种基于DBSCAN聚类算法的电力工程完整性分析方法.该分析方法包括数据获取、数据预处理、特征提取和聚类分析4个步骤,能从大规模电力工程数据中快速找出所缺失的数据,并对其进行形态分析.对电能表与智能终端数据缺失数量和数据缺失同步性进行多角度分析的结果表明,所提出的方法可以有效分析电力工程数据的完整性及其缺失的形态分布,对于提高电力工程数据的完整性及分析用户的用电情况均具有较好的参考价值.  相似文献   

3.
AP聚类算法是Frey和Dueck在2007年提出的一个先进的聚类方法.该算法具有较传统聚类算法更好的聚类性能,已被成功地应用于计算机科学的研究领域.为了获得高质量的聚类集,原始AP算法的迭代是在全部数据点之间交流信息,直到收敛.由于这种算法在计算数据时需要占用二次CPU时间,不适用于大规模的数据集,因此,本文在AP算法的基础上提出了一种有效的聚类算法.该算法在迭代时可修剪不必要的信息,且在计算消息收敛的同时确定迭代集群,并对算法进行了实验,证明算法是有效的.  相似文献   

4.
数据缺失的存在不仅会增大统计分析的复杂性和难度,还会导致分析结果的偏倚。比较了半参数方法和BP神经网络方法在分量指标数据符合正态分布且为随机缺失机制情况下的优劣。选取鸢尾花数据集进行模拟研究,在不同的缺失率下通过回判,得到了半参数方法与BP神经网络的准确率,并将两种方法分别运用到不完全的脂肪肝临床数据中。结果表明,两种方法都适用于处理小样本情况下的缺失数据问题,当缺失率较小时基于BP神经网络的准确率较高,当缺失率不断上升时,半参数方法的处理结果比较稳定。  相似文献   

5.
运用SAS9.0、数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,采用多重填补法(MI)、期望值最大化法(EM)和回归插补法(Regression)对各缺失数据集进行处理,对结果进行比较和分析.结果表明,对不同缺失率的数据集,MI、EM和Regression法对缺失值的处理各有优劣.  相似文献   

6.
针对目标姿态图像缺失的情况,提出通过姿态图像合成的方式增加训练集的姿态覆盖程度,并将扩充后的图像也用于训练目标分类器.受稀疏表示模型的启发,建立了一种合成孔径雷达图像姿态合成模型.该模型根据少量已知姿态的图像,线性组合出缺失姿态下的近似图像.在运动和静止目标获取与识别数据集上的实验表明,通过合成缺失姿态下图像的方法可有效提升目标识别的精度,特别是在训练数据集中姿态缺失严重时,文中方法提升尤为明显.  相似文献   

7.
为了提高地震数据的重构效果,提出了一种基于非下采样Contourlet变换(NSCT)自适应阈值的插值方法。该算法对缺失地震数据进行变换,并利用NSCT变换系数计算N次迭代对应的阈值。每次迭代时自适应选取阈值对各方向各尺度的NSCT系数进行处理,利用未缺失地震数据填充到反变换后的缺失地震数据中,完成缺失地震数据的重构。实验结果表明,利用NSCT变换的平移不变性和自适应阈值处理,对均匀丢失和随机丢失的地震数据进行插值重构,能得到更好的插值效果。  相似文献   

8.
在利用光学运动捕捉技术获取手部精细运动数据及手势信息的过程中,捕捉运动数据的缺失会对神经解码的性能产生影响,为此,提出一种基于主成分分析的缺失运动数据恢复和重建方法.该方法采用期望最大化算法在主成分空间和原始数据空间进行迭代映射,求解对应主成分空间,以提高原始空间数据修复的精度.实验分别从缺损数据长度、缺损数据维度、周期性运动数据及冗余数据等方面对该算法进行了验证,并与三次样条插值和一次迭代插值的结果进行了比较.对测试数据的实验结果表明:该方法适用于连续缺损数据长度小于350帧,或同时缺损数据维度小于13维的情况.手部运动的周期性规律对于提高数据恢复的精度有很大的帮助,冗余标记点也能在一定程度上减少数据恢复的结果误差.与三次样条插值和一次迭代插值方法相比,该方法的平均误差均小于10 mm,仅相当于前两种方法误差的50%,甚至更少.  相似文献   

9.
针对一般相关反馈的基于内容图像检索(CBIR)方法不能有效处理相关图像和非相关图像的问题,提出了一种基于最佳路径森林分类(OPF)的贪婪学习方法(GL OPF),该方法旨在返回每次迭代查询的最相关图像。首先,查询图像和数据集图像通过Gabor小波变换提取特征向量;然后,通过GL OPF主动学习方法获得图像关联性反馈,生成标记训练集;最后,标记训练集通过OPF分类器进一步评估形成相关性和非相关性原型集,每次迭代都会返回查询的最相关图像。3个公开图像数据集Caltch101、Corel和Pascal上的实验验证了本文方法的有效性。实验结果表明,在3个数据集中,迭代8次时,GL OPF的查询精度比其他3种方法均有较大提高,此外,GL OPF的迭代运行时间和查询时间与OPF几乎相同,很大程度改进了OPF方法。  相似文献   

10.
聚类算法初始聚类中心的优化   总被引:1,自引:0,他引:1  
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.  相似文献   

11.
基于K邻近(KNN)算法和随机森林算法,提出了一种无线网络中丢失数据的重建方法。首先将多维原始数据通过不稳定无线信道进行发送,接收端将接收到的完整原始数据集中,利用KNN算法筛选出部分和重建特征相关性较高的特征,用于构造随机森林模型。然后输入缺失的数据样本,随机森林模型自适应地对数据样本进行分类,并利用完整样本对缺失特征值进行预测,从而完成丢失数据的重建。最后通过仿真实验表明,该方案可以有效地提升数据重建的精确度,在数据丢失率达到80%的情况下,重建数据的准确率仍然优于现有的解决方案。  相似文献   

12.
模糊聚类分析在农业经济中的应用及编程处理方法   总被引:3,自引:0,他引:3  
模糊数学在实际中的应用几乎涉及到国民经济的各个领域及部门.因此模糊聚类方法是通常采用的方法,本篇文章主要突出了两个问题(1)对有限论域上的模糊聚类分析用已编写的程序进行处理.它不需掌握聚类分析方法,只要采集到原始数据,运行程序后,按提示输入数据,选择不同的算法,直接就可以得到模糊聚类分析的结果,其次解决了模糊聚类分析时的大量计算问题.(2)作为程序的应用,用模糊聚类分析的方法对承德市八县三区农业经济状况运行程序自动进行聚类分析.为了按模糊聚类分析的步骤分析问题,我们分步骤进行(程序的功能可分步进行也可直接得到分析结果).  相似文献   

13.
产业集群是一种新的区域发展趋势。浦东会展产业已经形成了相对完整的产业集群。在此背景下,基于GEM理论模型,依据上海浦东会展产业调查数据的分析结果,构建了上海浦东会展产业集群竞争力的指标体系,得出了各指标的权重分布;通过对各指标数值的定量分析,得出其会展产业竞争力指数,从而找到了上海浦东会展产业集群的薄弱环节,并提出了对策,以期提高竞争优势,推动上海浦东会展产业集群的进一步发展。  相似文献   

14.
对于两高斯混合分布,很难求参数的极大似然估计,当然也不便于影响分析.为此,这里通过引入遗失数据并利用EM算法,将局部影响分析建立在完全数据的似然函数基础上,并分析了一种特殊扰动对几个有代表性的参数的估计的影响、且以一例示之.  相似文献   

15.
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1) 需要预先知道聚类的数量;2) 对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。  相似文献   

16.
分层子树合并聚类算法   总被引:1,自引:1,他引:1  
为了解决传统分层合并聚类算法可能产生不唯一的二叉树结果问题,提出了分层子树合并聚类算法, 其基本思想是通过在数据集的最小树中分析θ-极大紧邻子树然后合并它的顶点集,该算法每步可将多个对象聚类,计算结果用多叉树表示.在理论上证明了该树在不计分支次序时是唯一的,并且通过计算实验说明,在样本中存在较多距离彼此相等的点对时,该树所描述的聚类结果要明显比传统分层合并聚类算法用二叉树描述的聚类结果更为合理.  相似文献   

17.
针对Internet网络延迟监测点的放置问题,将其转化为网络拓扑图聚类问题。根据网络层次结构特性,使用层次聚类法对网络节点进行聚类。利用网络节点的差异性,提出使用递归去除1度异常节点算法,在保证网络拓扑结构基本不变的前提下减少异常节点对聚类结果的影响。提出在聚类结果的每个类中选取度数最大的节点作为对应的类中心,监测点被放置在类中心位置上。实验结果表明,层次聚类法中最长距离法更适合对网络节点进行聚类,递归去除1度异常节点算法能够进一步提高聚类效果,有效地解决了监测点的放置问题。  相似文献   

18.
基于Python的聚类分析及其应用   总被引:1,自引:0,他引:1  
在研究聚类基本原理及相应算法的基础上,着重分析了层次聚类算法和k-means分割聚类算法,并比较了这两种算法的特点.结合Python语言的特点,编写程序实现了k-means聚类算法在博客数据集上的聚类应用,给出了详细的聚类实验结果分析.  相似文献   

19.
WSN中基于FCM算法的多目标跟踪数据融合   总被引:2,自引:0,他引:2  
基于LEACH(低功耗自适应聚类路由算法)路由协议, 研究了多目标跟踪的数据融合方法. 在基于模糊聚类(FCM)算法进行数据融合设计时,发 现算法存在错误跟踪、丢失新目标和重复跟踪的问题. 针对这些问题产生的原因进行了详细 的分析,并提出了改进,使FCM算法更好地应用于传感器网络.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号