首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
概念漂移是数据流挖掘中具有挑战性的问题.当概念漂移发生后,原有分类模型的分类正确率会显著下降,因此需要及时发现并调整模型以适应这些改变.概念重现是概念漂移的特殊情况,然而已有的算法大多未能充分考虑这种状况.为此,提出一种能够处理重现的概念检测方法.试验结果表明,该方法能够以较低的延迟和较低的误报率检测到概念漂移,并且可以识别重现的概念,很大程度上提升了分类器的分类正确率.  相似文献   

2.
文章针对概念漂移检测分类器很难维持较高的分类性能,存在错误检测和延迟检测等问题,提出了一种基于信息熵的概念漂移检测算法。首先,使用信息熵对动态数据流中的概念漂移进行检测;然后,将检测到的概念漂移信息,在概念池中进行汇总和统计;最后,使用了两种公开的真实数据和一种人造概念漂移数据进行实验,并对实验结果进行分析,验证了模型的有效性和正确性。实验结果表明,该算法可以有效地检测概念漂移和更新分类器,同时表现出较好的分类性能。  相似文献   

3.
分析了基于内容过滤的反垃圾邮件技术存在的不足,如概念漂移和偏斜类分布会导致召回率降低.在Minoru Sasaki和Hiroyuki Shinnou提出的邮件检测方法的基础上,对特征选择算法做了改进,并增加了自动学习机制,提出了一种基于改进K-均值聚类的垃圾邮件过滤算法.实验表明此方法能较好地适应概念漂移和偏斜类分布现象.  相似文献   

4.
为了更准确快速地处理或适应概念漂移,提出了基于原型学习的数据流分类算法,基于发掘并优化现有方法存在的问题,提出了新的方法模型SyncPrototype,在预测方法、原型判定与更新方法等处理概念漂移问题的关键部分做出了新的尝试与优化.实验结果证明,相较于现有方法,SyncPrototype模型在分类性能、概念漂移的响应速度以及时间性能等方面都有明显提高,能够更加有效处理并适应数据流概念漂移问题.  相似文献   

5.
针对隐含概念漂移和噪声的数据流,提出一种基于模糊积分融合的数据流分类方法(fuzzy integral ensemble classifiers for mining data streams, FI-MDS)。将模糊积分融合方法与集成综合技术有效结合起来,首先通过基分类器对识别样例进行分类得到决策剖面,然后再用模糊积分融合方法得到最终的分类结果,同时引入动态权值更新以提高算法的适应性。实验结果表明,与传统的数据流分类算法相比,该方法提高了概念漂移的检测精度,有效地解决了数据流中复杂分类问题,具有良好的分类性和健壮性。  相似文献   

6.
针对现有的大多数数据流集成分类算法对分类器的评估时未考虑历史数据的重要性,同时忽略对无关属性和噪声属性干扰的处理等问题,提出一种基于深度属性加权的数据流自适应集成分类算法,旨在有效组合多个基于深度属性加权的朴素贝叶斯模型。通过在不同数据块中深入分析不同属性取值对类属性归属的贡献,并将学习到的局部属性权重作用于不同的属性取值,以降低噪声数据干扰。在评价基分类器时,权衡历史数据和当前最新数据的重要性;采用基于测试实例的分类器置信度和分类正确率权重的组合投票策略进行子分类器组合以提高整体分类性能。通过在多个基准数据集上与经典算法对比试验,本研究算法在分类正确率和概念漂移适应性上具有一定优势。  相似文献   

7.
数据流挖掘中的主要问题是概念流动和噪音污染。目前的数据流挖掘算法不能有效地处理数据流中的噪音,而一个理想的学习算法应该同时拥有对概念流动的敏感性和对噪音的健壮性。文中探讨了如何使用聚类方法在数据流中区分出噪音实例和难以学习的实例,并提出了相应的概念流动检测方法。在此基础上设计了基于推进技术的集合分类器算法RobustBoosting。通过在合成数据集和实际数据集上的实验,表明文中的算法即使在高达40%的类噪音时,与AdaptiveBoosting算法[1]相比,仍能保持更高的分类准确度,更快地收敛到新的目标概念。  相似文献   

8.
针对带有概念漂移的数据流的分类问题,提出一种新颖的能够识别并且适应概念漂移数据流的分类算法。该算法将原始数据流沿着时间轴划分为若干数据块后,选择第一块中有代表性的数据作为样本训练模型,从而减轻了噪声和边界对分类精度的影响,使得漂移检测能较为全面且对离群点不过于敏感;此后对随后的数据块进行分类,并依据分类结果动态修正当前分类模型。实验结果表明:该方法能够根据数据流的当前状况自动调整分类模型,快速适应数据流概念漂移的情况,并得到较好的分类效果。  相似文献   

9.
为满足皮纳卫星高维遥测数据的实时、自动化、抗概念漂移等处理要求,提出一种基于聚类的遥测数据异常检测方法,包括子空间搜索和两阶段遥测数据聚类处理两部分.子空间搜索,通过熵值实现所有遥测数据低维子空间划分,降低计算复杂度,避免"维度灾难"的发生;两阶段遥测数据聚类处理,在线阶段通过网格索引实时发现单点异常,离线阶段通过聚类挖掘数据的集体异常及其特征,满足快速异常检测和复杂异常检测两种需求,并通过正常状态数据的迭代更新和算法的自适应修改,抵抗概念漂移.ZDPS-1A卫星历史遥测数据的分析结果表明,皮纳卫星遥测数据异常检测聚类方法在线阶段能实时处理10 kHz的流量数据,发现95%的单点异常,满足皮纳卫星实时遥测数据异常检测的一般需求;算法自适应了卫星快速转动导致的数据漂移,维持了稳定的单簇形态;同时相比原边界检查系统早一个月检测出姿态确定与控制系统中程序跑飞引起的太阳敏感器数据紊乱故障.所提出的算法针对性解决了高维、存在概念漂移的遥测数据异常检测问题,能实时检测单点异常,具有集体异常挖掘能力,适用于皮纳卫星星座组网的地面监控系统.  相似文献   

10.
为了构建一个具有良好的学习性能和推广能力的异常检测分类器,在结构风险最小(SRM)原则下讨论了基于支持向量机(SVM)的异常检测分类器的设计准则,提出了SVM分类器模型及其参数快速选择和评估方法,并给出了异常检测分类器训练步骤.针对KDD'99网络入侵检测数据集,实验结果表明,该方法能够有效地缩短入侵检测分类模型建立时...  相似文献   

11.
通过对投影非负矩阵分解(PNMF)增加近邻保留假设,提出了一种新的高光谱图像线性特征提取方法———近邻保留投影非负矩阵分解(NPPNMF)。NPPNMF保留了高光谱数据在低维特征空间中的局部几何结构,克服了PNMF基于Euclidean的缺点。根据在构造k近邻图时是否使用训练样本的类标签信息决定了NPPNMF既可以是无监督的特征提取方法,也可以是有监督的特征提取方法,从而提高了PNMF算法的鉴别力。理论证明和高光谱图像数据的分类结果表明了该方法的有效性及应用潜力。  相似文献   

12.
一种提高三维医学数据场边缘过渡区域图像质量的算法   总被引:1,自引:0,他引:1  
在对医学三维数据场模糊特性的分析基础上,提出了一种提高三维医学数据场边界过渡区域图像质量的体元投射算法。论详细说明了算法流程,包括特征区域的提取方法和基于体元合并的数据场绘制方法。实验表明,算法既提高了过渡区的图像质量,也保证了绘制速度。  相似文献   

13.
双树复解析小波变换(DT-CWT)在信号去噪方面的性能优于实小波变换,且计算量远小于后者.文章基于DT-CWT小波理论,通过对海洋环境噪声中舰船噪声中低频线谱信号小波系数的层间联合分布的分析,提出一种DT-CWT统计模型并推导出最大后验概率估计子(MAP),用于检测海洋噪声背景中的舰船噪声中的低频线谱信号.对实测舰船噪声信号和海洋环境噪声的分析表明,所提出的DT-CWT统计模型算法明显优于VisuShrink、SureShrink和BayesShrink算法对舰船噪声中线谱信号的检测效果.  相似文献   

14.
文章提出了一种新型单束激光-连续超声波空气流动速度测量方法.该方法利用连续超声波在运动空气流场中传播时,超声波传播速度音速与空气运动速度叠加的物理现象,采用激光-超声干涉原理,通过测量波长变化,实现对空气流动速度的测量.建立了试验验证系统,通过测量静止流场中的音速与均匀流场的速度,验证了该方法原理的正确性和技术可行性.该方法对流动现象不产生任何干扰与改变;不存在流动速度方向判别以及信号失真、丢失与辨别等复杂测量技术问题; 可直接测量流场中任意一点瞬时速度;具有测量精度高、数据处理简单、成本小、造价低、操作简便等优点;易于实现"阵排列激光-超声测量技术",有望进行多个截面的速度测量以及非定常流场测量,适用于研究集中涡、二次涡、不规则分离等多种复杂流动现象.  相似文献   

15.
为了降低支持向量机对不平衡数据的倾向性影响,以及减弱其对噪声点或野值点的敏感,提出了一种新的模糊支持向量机隶属度函数设计方法.该方法分析产生倾向性的原因,有效地区分样本对分类面的贡献,合理地设计隶属度函数.最后通过对含噪声的非均衡数据实验表明,该方法平衡了倾向性,提高了预测分类精度,从而增强了支持向量机在入侵检测和故障诊断等方面的应用.  相似文献   

16.
计算机网络入侵通常具有高频度特性,因此,识别是否正常访问,对数据流中重复元素的挖掘,给出频度指标,是一种重要的依据。提出一种基于数据流频繁模式的改进型AFP算法,该算法采用滑动窗口树技术,单遍扫描数据流及时捕获网络上的最新模式信息,并将该算法应用在入侵检测模型中正常数据和异常数据的在线挖掘。解决了有限存储和无限数据流的矛盾。实验结果表明,该模型有较高的报警率和较低的误报率。  相似文献   

17.
基于传感器的人类活动识别(HAR)在健康医疗领域具有重要的研究价值及研究意义。以往的关于传感器人类活动分类识别算法的研究,并没有考虑不同类别行为数据间的不平衡性。为了解决不同行为类别数据间的不平衡性影响算法精确度的问题,此算法采用下采样方法从大类和小类数据集中随机抽取选出若干组数量上相等的两种数据的集合,将多个不平衡数据变成平衡数据。其次,多个平衡数据集上训练多个弱分类器。然后,此算法以弱分类器的负相关和预测精度为代价函数,使用遗传算法挑选出能够使代价函数值最高的弱分类器来构成集成分类器。使集成算法内的弱学习器具有较高预测精度和多样性。最后,此算法使用挑选出的弱学习器构成集成学习器对人的行为进行集成分类。此算法在已有的行为数据集上进行了仿真实验研究,实验结果证明本文提出的基于遗传的负相关剪切集成不平衡行为识别算法相对于传统算法能够有效提高不平衡行为识别的正确率。  相似文献   

18.
水下多目标跟踪排序是水下航行器多目标跟踪中需解决的技术难点.目前用于水下多目标跟踪排序的方法都假设各个决策因素相互独立,而实际上水下多目标跟踪决策的因素之间存在着相互影响.文章根据这一特点,建立了水下多目标跟踪排序的决策指标集和相应的ANP决策模型,提出了基于ANP的水下多目标跟踪排序方法.该方法将水下多目标跟踪排序的决策指标集纳入网络层次结构模型,并通过模型解算得到优化的多目标跟踪决策,具有排序结果比现有方法更加合理、稳健的特点.仿真结果表明该方法是解决水下多目标跟踪排序与决策问题的有效方法.  相似文献   

19.
基于三级信息融合结构的多平台多雷达目标识别算法   总被引:1,自引:0,他引:1  
为了解决多平台多雷达目标识别时空信息融合过程中存在的时效性不高,识别特征信息模糊和雷达识别结果高冲突等问题,提出了一种基于三级信息融合结构的多平台多雷达目标识别算法。一级特征融合中,基于模糊评判法解决了多特征识别信息模糊问题。二级空域融合中,基于DS融合规则和折扣融合规则,提出了以平均证据距离为阈值的自适应证据融合算法。三级时域融合基于多雷达序列信息,给出了时域自适应融合算法。仿真计算结果表明文中提出的融合结构能够在保证结果正确的同时,每个周期都能输出结果,时效性较之以往的融合结构有了明显改善。文中的自适应证据融合算法能够克服证据间可能存在的高冲突性,并且与采用折扣证据融合算法相比计算量显著减少。  相似文献   

20.
根据统计学习理论,间隔大小是反映泛化能力的一个很重要的方面. 受一类支持向量机(SVM)的启发,提出的双边界SVM能分别用2个边界对2类问题分类. 它能在保证分类正确的同时保证分类间隔的最大化,理论上分别从推广性能和不平衡类分布2方面证明了其优越性. 标准数据集上的实验表明,双边界SVM得到的分类间隔要大于SVM, 泛化性有了显著提高;另外,不平衡数据集上分析得到它对少数类识别率有明显提升. 真实入侵数据测试结果表明,双边界SVM算法比边界样本选择算法的检测率高出2%以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号