首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为准确高效地识别核爆电磁脉冲(nuclear electromagnetic pulse,NEMP)和闪电电磁脉冲(lightning electromagnetic pulse,LEMP),提出一种基于自适应信号分解和集成学习的识别分类方法。首先,针对样本不均衡问题,利用数据扩增方法对数据集进行预处理;然后,采用希尔伯特-黄变换对NEMP和LEMP分别进行自适应信号分解;其次,对分解信号提取其在时域、频域和小波域的特征;最后,对提取特征采用集成学习算法进行识别分类。试验结果表明,该方法在实测数据上的准确率能够达到99.99%以上,LEMP信号的误报率低于万分之一。  相似文献   

2.
面向不均衡训练集的印刷图像套准状态检测方法   总被引:1,自引:1,他引:0  
简川霞  高健 《包装工程》2018,39(11):158-164
目的针对不均衡的印刷图像套准状态检测中存在的印刷套不准图像识别准确率低的问题,研究不均衡印刷图像训练集的预处理方法。方法提出不均衡印刷图像训练集数据的集成采样预处理方法。支持向量机先将不均衡的训练集数据分为支持向量和非支持向量,然后过采集少类样本(即印刷套不准图像)中的支持向量,欠采集多类样本(即印刷套准图像)中的非支持向量,实现训练集数据的均衡化。最后采用预处理后的均衡训练集对支持向量机模型进行训练,并优化模型参数。结果采用文中提出的集成采样方法对不均衡训练集预处理后获得支持向量机模型,通过对印刷图像套准状态进行识别,获得的少类样本识别率a+为0.9375,识别准确率几何平均数Gmean为0.9437,F测度为0.9574。结论文中提出方法获得的印刷套不准图像识别准确率a+,Gmean和F测度均优于实验中的其他方法。  相似文献   

3.
在机械故障诊断中,由于故障样本难以收集且数量远远少于正常样本,即产生数据集不均衡问题。这将导致传统的分类算法如支持向量机(SVM)在处理不均衡分类问题时对少数类样本(故障样本)的分类准确率过低。加权支持向量机(C-SVM)算法是一种处理样本集不均衡问题的常用算法,可以在一定程度上改善少数类样本的分类准确率。但是在故障程度相近时会导致样本间距过小,加权C-SVM算法对这类故障样本的识别精度不理想。为提高数据集不均衡下故障程度相近样本的分类准确率,采用二叉树结构与加权C-SVM相结合的方法,综合考虑样本类间距离、类内距离和不均衡程度,优化二叉树结构。结果表明,该算法能够有效处理样本距离过近的不均衡数据集分类问题,从而提高了故障程度相近样本的分类准确率。  相似文献   

4.
简川霞  叶荣  林浩  贺鑫  杜美剑 《包装工程》2020,41(21):251-260
目的 针对印刷标志图像训练数据集非均衡性导致印刷标志图像中少类数据套准状态识别准确率低的问题,提出改进的SMOTE训练集过采样方法,以提高少类数据的识别准确率。方法 提取印刷标志图像灰度行程矩阵的纹理特征,组成多维的模型输入特征数据。基于少类样本的邻域信息,得到少类样本的过采样参数。对少类样本采取不同的过采样策略,实现训练集样本的均衡。使用均衡的训练集建立支持向量机模型,实现对印刷套准状态的识别。结果 实验结果表明,文中方法在不同非均衡印刷数据集上,获得的平均分类准确率几何平均数Gmean为0.8507,召回率Re为0.7192,ROC曲线下面积A为0.8549。结论 文中方法在不同非均衡印刷套准数据集上的分类性能要优于实验中的SMOTE,IS和SVM等方法。  相似文献   

5.
研究了基于机器学习分类算法的恶意代码检测,考虑到目前主要采用传统分类方法对恶意代码进行分类识别,这些方法需要通过学习大量标记样本来获得精准的分类器模型,然而样本标记工作只有少数专家才能完成,导致标记样本往往不足,致使分类结果准确率不高,提出了一种基于协同采样的主动学习方法。运用这种学习方法,仅需少量标记样本即可有效识别出恶意代码。实验证明,相对于传统的恶意代码分类方法,该方法能够显著提升分类准确率和泛化性能。  相似文献   

6.
针对工业系统监控数据不均衡导致的故障状态难以被识别问题,提出一种基于随机旋转森林的集成支持向量机(RRFESVM)故障诊断算法,通过将监控数据进行属性随机分割、组合、PCA变换和样本有放回重采样,组建多个新训练子集并使用支持向量机算法进行训练,得到多个支持向量机故障诊断基分类器,集成得到强分类器,由此既保证基分类器之间的差异性,又保证故障诊断精度和分类器性能稳定性,从而解决故障诊断易偏置问题,提高作为少数类的故障状态实时诊断准确率。亚轨道飞行器再入过程实验与TE化工过程实验都表明RRFESVM故障诊断算法能够有效提升不均衡数据情况下的实时故障诊断性能。  相似文献   

7.
情感分类是一种从文本中提取情感倾向的文本分类任务。集成学习通过结合几个分类器,在情感分类任务上能够获得比个体分类器更好的分类效果。但是,由于个体分类器在数据集上的表现不同,个体分类器在集成方法中的权重难以确定。针对集成学习中个体分类器的权重优化问题,提出一种基于差分进化优化个体分类器权重的集成分类方法,并将其应用于中文情感分类。以分类准确率为适应度值,通过差分进化算法优化5种个体分类器的权重组合,在3个领域的评论语料集上进行实验。实验结果表明,与一般的集成方法相比,该方法在中文情感分类上有更好的分类效果。  相似文献   

8.
现有的无线电信号调制识别方法在先验数据不足时通常很难对无类标信号进行有效识别。针对这个问题,本文提出了一种基于知识迁移的深度学习无线电信号聚类方法(DTC)。该方法基于样本对比,分析样本间的相似性,并利用卷积神经网络(CNN)提取无线电信号的特征,同时设计了一种预训练框架,通过迁移同领域数据集的知识,有效提升了CNN特征提取能力,实现了引导聚类方向、提升聚类性能的目标。实验结果表明,该方法在多个公开数据集上的聚类性能都显著优于现有的聚类方法。与现有方法相比,DTC在RML 2016.10A和RML 2016.04C数据集上的聚类精度分别提升了30.34%和28.04%。  相似文献   

9.
多波束测深声呐的反向散射数据中包含海底表层的声学信息,可以用来进行海底表层底质分类。但实际中通过物理采样获得大范围的底质类型的标签信息所需成本过高,制约了传统监督分类算法的性能。针对实际应用中只拥有大量无标签数据和少量有标签数据的情况,文章提出了基于自动编码器预训练以及伪标签自训练的半监督学习底质分类算法。利用2018年和2019年两次同一海域实验采集的多波束测深声呐反向散射数据,对所提算法进行了验证。数据处理结果表明,相比仅利用有标签数据的监督分类算法,提出的半监督学习分类算法保证分类准确率的同时所需的有标签数据更少。自动编码器预训练的半监督学习分类方法在有标签样本数量极少时的准确率仍高于75%。  相似文献   

10.
针对农作物病害图像类间差异较小,传统机器学习方法在农作物病害数据集上识别精度低、模型训练复杂等问题,本文提出一种基于共有特征学习和数据增强的农作物病害识别算法。首先,对于农作物病害数据集类间数据不均衡等问题,本文使用Mixup数据增强算法对数据集进行扩充,丰富样本数量;然后,对于特征提取模块,本文在深度残差网络中嵌入通道注意力模块,使之侧重学习农作物叶片病害特征,忽略背景信息对模型带来的干扰;最后,在提取完图像特征后,将特征图送入到共有特征学习模块中,提高图像之间线性关联,增强模型泛化性能和鲁棒性。为验证所提模型的有效性和实用性,本文在Plant Diagnosis Dataset农作物病害数据集上进行训练及测试,实验结果表明,所提模型准确率达到97.9%,可有效提高农作物病害图像识别精度。  相似文献   

11.
针对机械故障数据的高维性和不平衡性,提出基于格拉斯曼流形的多聚类特征选择和迭代近邻过采样的故障分类方法。对采集到的振动信号,提取时域和频域相关特征,利用多聚类特征选择将高维数据以局部流形结构映射到低维特征集合。无标签样本借助迭代近邻过采样以恢复最大平衡性为目标进行样本分类,并对剩余无标签样本进行模糊分类。选取滚动轴承正常、外圈、内圈以及滚动体的故障数据,并与支持向量机、基于图的半监督学习算法进行对比。结果表明,提出的方法能有效识别出少数类故障,并在整体上有显著的分类效果。  相似文献   

12.
利用迁移学习算法提高分类识别的准确率是运动想象脑机接口应用的热点研究问题,其中样本迁移和特征迁移的传统模型算法在样本量较少或源域数据和目标域数据差异较大情况时,各自的迁移效果并不理想。基于欧式对齐(EA)和改进联合类质心匹配和局部流形自学习(CMMS)迁移学习的运动想象分类算法,将样本迁移和特征迁移的优势有机结合,在考虑样本本身的同时,进一步提高了分类准确率。首先,对样本进行源域和目标域的EA,减少源域和目标域的数据分布差异;其次,基于最小化最大均值差异(MMD)改进CMMS方法,筛选源域数据,再次减小源域样本与目标域的分布差异;最后,将该方法应用于BCI竞赛数据集进行离线测试和在线实验。实验结果表明:所研究的方法与SVM、JDA、BDA、EasyTL、GFK、CMMS相比较,迁移学习模型的识别准确率分别提高了14.38%,8.5%,5.8%,10.4%,11.8%,5.7%。  相似文献   

13.
针对钢筋混凝土腐蚀检测中单一传感器或检测方式获取锈蚀特征信息不足及准确率不高等问题,提出一种改进神经网络模型结构下对集成阳极梯、应变力、温度传感器的多传感器数据融合检测方式。首先将一维多传感器数据二维化,采用卷积核对特征信息滤波提取,提取后的信息平展后连接BP残差神经网络层,增强浅层低非线性度特征信息向深层网络的直接传递和重复利用,提高网络模型的拟合及泛化能力。针对ADAM优化算法在模型训练后期学习率可能震荡不收敛问题,引入分段学习率衰减策略抑制后期震荡,同时对二阶矩估计梯度变化进行调整,提高迭代收敛效率。仿真结果表明,改进后的ADAM-CNN算法模型具有更好的分类性能,在钢筋腐蚀样本测试集上的平均准确率为96.2%。  相似文献   

14.
简川霞  陈鑫  林浩  张韬  王华明 《包装工程》2021,42(15):275-283
目的 针对目前印刷套准识别方法依赖于经验人工设计特征提取的问题,提出一种不需要人工提取图像特征的卷积神经网络模型,实现印刷套准状态的识别.方法 采用图像增强技术实现不均衡训练集的均衡化,增加训练集图像的数量,提高模型的识别准确率.设计基于AlexNet网络结构的印刷套准识别模型的结构参数,分析批处理样本数量和基础学习率对模型性能的影响规律.结果 文中方法获得的总印刷套准识别准确率为0.9860,召回率为1.0000,分类准确率几何平均数为0.9869.结论 文中方法能自动提取图像特征,不依赖于人工设计的特征提取方法.在构造的数据集上,文中方法的分类性能优于实验中的支持向量机方法.  相似文献   

15.
针对机械故障诊断中准确、完备的故障训练样本获取困难,而现有分类方法难以有效地发掘大量未标记故障样本中蕴含的有用信息,提出了一种基于在线半监督学习的故障诊断方法.该方法基于Tri-training算法将在线贯序极限学习机从监督学习模式扩展到半监督学习模式,利用少量不精确的标记样本构建初始分类器,并从大量未标记样本中在线扩充标记样本,对分类器进行增量式更新以提高其泛化性能.半监督基准数据试验结果表明,训练样本总数相同但标记样本数与未标记样本数比例不同时,所提算法得到的分类准确率相当且训练时间相差小于1.2倍.以柴油机8种工况的故障模式为对象进行试验验证,结果表明标记故障样本较少时,未标记故障样本的加入可使故障分类准确率提高5%~8%.  相似文献   

16.
针对滚动轴承故障诊断中样本分布不均衡引起的模型泛化能力差、诊断精度低的问题,从两个方面展开研究:(1)故障样本增广,提出结合变分自编码器(VAE)和生成对抗网络(GAN)的VAE-GAN样本增广模型;(2)改进分类算法,提出基于焦点损失(FL)和卷积神经网络(CNN)的FLCNN(focal loss and convolutional neural network)样本分类模型。在此基础上,将VAE-GAN和FLCNN融合,构建VAE-GAN+FLCNN轴承故障诊断模型。首先,将样本量少的故障类输入VAE-GAN模型,通过交替训练编码网络、生成网络和判别网络,学习出真实故障样本的数据分布,从而实现故障样本的增广;然后用增广后的数据样本训练FLCNN分类模型,完成轴承故障识别。试验对比结果表明,所提方法能够有效提升样本不均衡条件下的轴承故障诊断效果,拥有更高的Recall值和F1-score值。  相似文献   

17.
张立国  刘博  金梅  孙胜春  张勇 《计量学报》2021,42(12):1578-1584
针对现有的单一细粒度识别模型不能识别无训练样本花卉子类这一实际情况,结合DCL与KNN提出了一种将细粒度特征映射到高维空间自动分类的方法,实现无训练样本的子类分类。同时针对同一花卉子类特征较为相似且可能存在类间样本不均衡问题,改进了DCL模型的损失函数(focal loss),通过对比损失(contrastive loss)加大子类的类间距,用focal loss平衡类别损失。最后在308类样本不均衡的牡丹花上进行实验。实验结果表明:改进算法后有训练样本的子类准确率为0.932,F1值为0.925,较原始DCL算法有了较大的提升,对未训练样本的子类准确率为0.903,F1值为0.888。  相似文献   

18.
黄永毅 《硅谷》2013,(12):34-35
针对标准支持向量机在处理不平衡数据问题的缺陷,提出一种解决方法,首先采用一种改进上采样方法(Over-sampling)—SMOTE来平衡正负样本的数目,达到缓解两类样本数目悬殊的目的。然后引入差异惩罚思想对两类样本进行不同程度的惩罚。实验表明,本文提出的SDPC-SVM分类算法在处理不平衡数据的分类问题上具有可行性与有效性。  相似文献   

19.
滚动轴承的智能故障诊断是设备安全、高效运行的重要保障。然而,非平稳的运行工况使采集到的训练数据集呈现不完备的特点,导致基于数据驱动的模型仅能从中学习到极为有限的诊断知识,致使诊断准确率大幅下降。针对此问题,以生成扰动样本扩充原始数据集的完备性为目的,提出了标准自学习数据增强故障诊断方法。该方法包含标准自学习和数据增强两个训练步骤,将一维卷积神经网络的训练过程看作模型自学习出评判扰动样本的标准,基于此标准,采用样本参数化与模型数据化方法生成扰动样本。两步骤交叉进行,不仅能生成扰动数据、增强数据集完备性,同时能获得非平稳工况下的故障诊断模型。此外,通过研究不同数据生成次序的样本差异,发现所提方法在生成数据时,通过数据生成距离与方向的随机性叠加,保证了生成样本的多样性。实验结果表明所提方法在不完备的训练数据集下对非平稳工况样本的诊断具有有效性和优越性。  相似文献   

20.
针对旋转机械故障特征集非线性强、维数过高导致分类困难的问题,提出一种基于局部质心均值最小距离鉴别投影(Local Centroid Mean Minimum?distance Discriminant Projection,LCMMDP)的故障数据集降维算法。该算法在考虑样本的内聚性和分离性的同时,能够保持样本局部几何结构信息,反映样本与局部质心均值之间的近邻关系。从多个角度提取机械振动信号的混合特征,构建原始高维特征集,通过 LCMMDP 提取出低维敏感特征子集,利用改进的基于局部均值与类均值的 k?近质心近邻分类算法(k?nearest Centroid Neighbor Classification Based on Local Mean and Class Mean,KNCNCM)进行故障模式识别。所提方法集成了 LCMMDP 在维数约简和 KNCNCM在模式识别的优势,可得到较高的故障识别准确率。分别使用一个双转子系统数据集和仿真数据集验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号