首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对多维数据集异常数据检测过程中未对多维数据集进行降维处理,导致多维数据集中异常数据检测精度较低、误检率较高、检测时间较长的问题,提出一种基于谱聚类的多维数据集异常数据检测方法。首先,通过拉普拉斯矩阵对多维数据集中的数据进行聚类,初步分类数据;其次,采用局部线性嵌入(LLE)算法对分类后的数据进行降维处理,用特征向量表达高维数据集,去除多维数据集中的冗余信息;最后,将处理后的多维数据集输入到支持向量机模型中,根据回归估计值的计算,完成异常数据的检测。实验结果表明,本文算法进行多维数据集中异常数据检测的精度更高、误检率更低,检测时间较短。  相似文献   

2.
基于模式识别理论,提出了一种通过对多传感器的测量数据聚类,以区分来自同一目标的测量数据集合,结合聚类数据集与目标预测值,应用卡尔曼滤波器估计目标的运动状态,从而实现了各雷达站目标观测航迹的数据融合.实验表明了本算法的有效性.  相似文献   

3.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

4.
网格聚类在多雷达数据融合算法中的应用   总被引:1,自引:0,他引:1  
应用网格聚类的方法区分同一雷达接收的不同目标的观测数据,通过类间数据融合,实现同一目标不同雷达接收数据的融合,以便对多目标进行实时跟踪。研究了观测数据网格聚类的基本思想、形式化描述及算法实现,讨论了对机动目标跟踪的Kalman滤波方程及空管系统中易于计算的各参数矩阵理论依据及相应的初值。仿真结果表明,通过网格聚类能很好地区分不同目标,聚类后再进行跟踪融合更加准确。  相似文献   

5.
基于图划分的网状高阶异构数据联合聚类算法   总被引:1,自引:0,他引:1  
目前已有的高阶联合聚类算法主要集中于分析星型高阶异构数据,然而实际应用中,存在大量网状高阶异构数据。为了有效挖掘网状高阶异构数据内部隐藏的结构,本文提出一种基于图划分的高阶联合聚类算法(简称为GPHCC),该算法将网状高阶异构数据的聚类问题转化为多对二部图的最小正则割划分问题。为了降低计算复杂度,将此优化问题转化为半正定问题求解。实验结果表明GPHCC算法优于目前已有的5种二阶联合聚类算法和5种高阶联合聚类算法。  相似文献   

6.
基于数据划分最大信息的聚类有效性函数   总被引:7,自引:0,他引:7  
基于样本最大分类信息的改进划分系数仅仅利用了数据的模糊分类信息,为了将数据分类的几何结构信息考虑进去,结合数据分类的最大内变差,提出一个聚类有效性标准。实验结果表明,该方法具有良好的分类性能。  相似文献   

7.
统计数据调查多以行政单元为空间范围,为解决其在多源数据综合应用分析等方面的空间范围局限性,需对其进行网格化转换.提出一种基于多源数据融合的通用模型,先确定影响统计指标分布的因子,然后对单元格进行各因子的影响权重计算,将各因子的权重值叠加,最后通过单元格上的权重值和去调整统计指标值的分布.实验表明,该模型在基于遥感、地形、生态等数据融合基础上,能使网格结果在空间分配上更科学化.  相似文献   

8.
随着对实验精确度要求的不断提高,聚类分析中的不确定性数据聚类也越来越受到关注.然而经典的不确定数据聚类通常假设其概率密度函数(PDF)等信息是已知的,而现实过程中,这些指标并没有那么轻易就能获取.考虑到这些情况,可以利用三角模糊数来恰当有效地表示多维不确定性数据,并采用基于三角模糊数的低计算复杂度的距离计算方法,结合K-means基础聚类方法形成一种被命名为UTDK-means(Uncertain triangular fuzzy number data K-means)的聚类方法,而它是基于三角模糊数的.实验结果表明:基于三角模糊数的不确定数据聚类是可行的,具有一定的研究价值.  相似文献   

9.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

10.
基于模型的聚类方法研究   总被引:1,自引:0,他引:1  
分析基于模型的聚类方法及其典型算法;重点研究基于混合模型聚类算法的局限性及存在的问题.  相似文献   

11.
针对无线传感网(WSN)数据融合中基于模糊逻辑的加权融合算法融合结果误差偏大的问题,提出了一种基于K-均值聚类的改进的模糊逻辑加权融合算法.首先运用K-均值聚类的思想分析收集到的原始误差数据,去除算法认为不可靠的数据,用余下的有效数据对修正模糊逻辑算法求得加权因子,并与节点测量数据加权平均求值,得到最终融合值.实验证明:通过与其它同类的加权融合算法比较,该改进算法的融合精度更高,效果更好.  相似文献   

12.
地震数据网格化方法研究   总被引:9,自引:3,他引:9  
离散数据网格化是科学和工程研究领域中数据处理的核心技术,同时它也是科学可视化的前提。由于经济和地理条件的限制,在实际数据采集过程中采集到的地震数据是有限的,因此在处理地震数据的过程中进行数据补插网格化是必不可少的。本文介绍了四类网格化方法:趋势面拟合、插值、综合法(残差叠加法)、克里金法(Kriging),重点阐述了Kriging方法及其在地震数据网格化中的应用。  相似文献   

13.
基于视觉和语义融合特征的阶段式图像聚类   总被引:1,自引:0,他引:1  
针对互联网图像的特点,研究了图像聚类中的图像特征提取和聚类算法,定义了一个基于规则的线性特征融合函数,引入了自适应的参数选择机制对聚类粒度进行调整,提出了一个基于视觉和语义融合特征的阶段式聚类方法.新方法结合了不同层次的图像特征,利用现有多种聚类算法的优点对图像进行聚类,同时通过关键词权值计算,为每类赋予主题关键词,并将关键词重叠率高的类进行合并.基于均方差和用户评估的实验结果表明,新的聚类方法较传统的聚类方法具有更好的聚类效果.  相似文献   

14.
基于类云模型聚类的多目标数据关联算法   总被引:2,自引:0,他引:2  
针对多目标跟踪中的数据关联问题,提出一种基于类云模型c-均值聚类的数据关联算法.该算法采用类云模型c-均值聚类算法对目标有效回波进行聚类,将聚类中心作为目标最终观测值,运用最近邻法对聚类中心与航迹进行关联,用Kalman滤波器进行状态估计.实验结果表明,本算法与联合概率数据互联算法相比,跟踪精度高,计算量小,更适应于工程应用.  相似文献   

15.
基于 Improved-Hash方法的多维数据划分   总被引:1,自引:0,他引:1  
针对并行数据库系统的数据分布不合理而引起的操作并行化程度不高的问题,依据均匀的数据划分有利于提高查询效率的思想,提出了以Improved-Hash方法为基础的多维数据划分。此方法在优化并行数据库系统的查询操作,提高系统资源利用率方面有一定的指导作用。  相似文献   

16.
基于FCM算法提出一种结合减法聚类与聚类有效性评判的模糊c均值聚类算法Sub_FCM,该算法能自动确定合理划分类数并初始化聚类原型,建立一种基于交替优化策略的无监督机器学习自动分类模型,并详细阐述了该模型在怀柔交叉路口流量段自动划分中的具体应用.实例分析表明,该算法能很好地反映路口交通流数据的内在结构,自动划分出合理流量段,为进一步实施合理的控制算法奠定基础.  相似文献   

17.
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法--GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用“Gather-Apply-Scatter”的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。  相似文献   

18.
聚类分析是数据挖掘中一项重要的技术,通过对多维用户行为的聚类分析,可以从用户层面来帮助管理人员得到更为精确和有效的用户评价信息。该文首先从用户行为数据中提取多维用户行为特征,之后采用基于互信息的无监督特征选择(UFS-MI)模型对提取的特征进行排序、筛选并确定权重,得到每个用户行为的加权特征向量。根据用户行为之间的相似性构造网络,然后通过Blondel社团划分算法对用户行为网络进行聚类分析。在某公交线路的实证数据集上的实验结果表明,该方法的准确率为92%,比传统聚类算法K-means的准确率有明显提升,研究结果可以为公交公司的管理层在进行统一管理和培训时提供参考。本文的工作拓展了网络科学在多维用户行为数据聚类分析的应用范围,丰富了多维驾驶行为数据聚类分析的思路,为决策者提供参考依据。  相似文献   

19.
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边,对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确地分析出数据中存在的合理聚类和例外样本.  相似文献   

20.
针对纵向数据集的数据特征,如多维、含缺失值、序列不等间隔和不全等长等特点,研究一种基于Eros距离的纵向数据的相似性度量方法,并对模糊C均值聚类算法进行改进,提出一种基于Eros距离度量的模糊聚类数据处理方法.对于纵向数据集,首先进行缺失值填充、变量标准化等预处理,使用粗糙集理论对冗余属性进行约简,然后基于FErosCM聚类方法进行数据自动分类.对比实验证实此方法可用于纵向数据集的自动聚类处理,并使用信息熵作为聚类效果的评价手段。实验结果表明:无论在聚类效率还是准确度上,FErosCM方法对于纵向数据的分类处理均是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号