首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
戴妍妍  金赟  马勇  杨子秀  俞佳佳 《信号处理》2021,37(10):1835-1842
传统语音处理方式是把语音样本分割成固定长度的片段,但这种语音样本的切割会导致语音情感分类准确性下降。本文引入循环填充法处理可变长度的log-Mel谱图,该方法能够更好的利用时间动态信息,同时可以减少填充的无效数据对模型参数学习的干扰。由于人类的情感只能在语音中某些特定的时刻出现,为了寻找关键情感特征,本文构建了基于高效通道注意力机制的语音情感识别模型,其中高效通道注意力机制能够计算通道图的重要性,有选择的强调通道图,改进特定情感的表达。本文在交互式情感二元动作捕捉(IEMOCAP)数据库上进行相关实验,在IEMOCAP上采用循环填充法的加权精度(WA)和非加权精度(UA)分别达到73.2%和70.9%,采用本文提出模型的WA和UA分别达到76.0%和73.4%。   相似文献   

2.
针对卷积神经网络结构单一,模块中卷积核使用单一,网络特征提取不充分导致图片分类准确度不够,以及模型大的问题,提出卷积核交叉模块的网络设计。此模块先将输出特征图分成两组,每一组采用不同数量、不同大小的卷积核进行特征提取,然后将分组得到的特征图进行级联操作后再通过1×1的卷积核进行整合。该文设计的卷积神经网络与传统的网络相比,在食物101food数据集上将识别精度由56.7%提升至72.63%;在交通GTSRB数据集上将识别精度由96.3%提升至98.41%。实验结果表明,该文设计的网络结构性能优越,且网络模型较小。  相似文献   

3.
苏饶  李菲菲  陈虬 《电子科技》2019,32(7):43-48
针对局部二值模式描述子提取的纹理信息以及梯度幅值量化算子提取的边缘特征无法有效且全面地描述人脸信息的问题,文中提出一种基于马尔可夫稳态特征模型的多特征融合算法。首先,将通过GMQ算子提取的边缘特征以及通过LBP描述子提取的纹理特征分别与马尔可夫稳态特征模型进行融合,然后再将两者进行有效地线性加权融合。最后,在ORL数据集上进行的实验显示,文中提出算法的识别精度可达到 95.83%。与单一的特征提取算法以及常见的人脸识别算法对比结果表明了该方法的有效性。  相似文献   

4.
针对卷积神经网络只能使用相同尺寸图像和卷积核的网络进行特征提取,导致提取的特征不全面,在交通标志识别中因车载摄像头与交通标志的位置不断变化影响交通标志的识别精度等问题,提出了一种基于多尺度特征融合与极限学习机结合的交通标志识别方法。首先,将预训练适应3种不同尺寸图像的网络模型作为实验的初始模型;然后,融合3个网络模型构建多尺度卷积神经网络,将3个预训练网络的参数级联到融合模型的全连接层,对融合模型的全连接层进行训练,采用随机梯度下降算法更新网络参数;最后,将融合后的模型作为特征提取器提取特征,把提取到的多尺度特征送入极限学习机,实现交通标志识别。实验采用德国交通标志数据库(GTSRB)对算法性能进行测试,实验结果显示,多尺度特征融合与极限学习机结合的网络识别精度为99.23%,识别速度为46ms。相对于预训练的网络,网络的分类精度分别提高了2.35%,3.22%,3.74%。多尺度特征融合能够有效提取交通标志图像的特征信息,极限学习机可以提高分类精度和分类时间,该方法能满足交通标志识别的准确性和实时性的要求。  相似文献   

5.
针对当前人脸表情识别算法识别精度不高、网络鲁棒性差的缺点,设计了一种改进型Dense HRNet特征提取网络,使用稠密连接机制强化了HRNet中浅层特征与深层特征间的传递和融合方式。同时,提出了一种基于基尼指数动态加权决策算法,根据每一卷积神经网络(Convolutional Neural Network,CNN)支路分类的确定性,为各支路输出动态地赋予权重,提高多路CNN支路融合决策的准确性,解决了由于单路CNN分类不确定性引起的偶然误差。在FER2013数据集和CK+数据集上进行实验,所提方法分类准确率分别达到73.36%和97.59%。  相似文献   

6.
由于浅层卷积神经网络(convolutional neural network,CNN)模型感受野的限制,无法捕获远距离特征,在高光谱图像 (hyperspectral image,HSI) 分类问题中无法充分利用图像空间-光谱信息,很难获得较高精度的分类结果。针对上述问题,本文提出了一种基于卷积神经网络与注意力机制的模型(model based on convolutional neural network and attention mechanism,CNNAM),该模型利用CA (coordinate attention)对图像通道数据进行位置编码,并利用以自注意力机制为核心架构的Transformer模块对其进行远距离特征提取以解决CNN感受野的限制问题。CNNAM在Indian Pines和Salinas两个数据集上得到的总体分类精度分别为97.63%和99.34%,对比于其他模型,本文提出的模型表现出更好的分类性能。另外,本文以是否结合CA为参考进行了消融实验,并证明了CA在CNNAM中发挥重要作用。实验证明将传统CNN与注意力机制相结合可以在HSI分类问题中获得更高的分类精度。  相似文献   

7.
为了提高遥感图像场景分类中特征有效利用率,进而提高遥感影像分类精度,采用基于双通道深度密集特征融合的遥感影像分类方法,进行了理论分析和实验验证。首先通过构建复合密集网络模型, 分别提取图像卷积层特征和全连接层特征;然后为挖掘、利用图像深层信息,通过视觉词袋模型将提取的深层卷积层特征进行重组编码,捕获图像深层局部特征;最后采用线性加权方式将局部和全局特征融合、分类。结果表明,选用数据集UC Merced Land-Use和NWPU-RESISC45进行实验,取得的分类精度分别为93.81%和92.62%。该方法充分利用局部特征和全局特征的互补性,能实现图像深层信息的充分利用和表达。  相似文献   

8.
目前利用无人机获取光伏组件红外影像数据越来越多地应用于光伏组件故障检测中。但光伏组件红外影像数据各类别样本相似度较高,现有深度学习模型的光伏组件红外影像特征提取能力较低,导致光伏组件多故障类型分类精度偏低。针对以上问题,基于ResNet(residual network)模型构建ResPNet(residual photovoltaic network)模型进行光伏组件红外影像故障检测。ResPNet模型在ResNet模型基础上,加入了底层特征信息增强模块、多尺度特征信息增强模块、全局特征信息增强模块,用于提升模型的光伏组件红外影像特征提取能力。在公开的光伏组件红外影像数据集Infrared Solar Modules上进行实验,ResPNet模型的12类光伏组件红外影像分类精度达到84.6%,不但优于ResNet-50模型,而且优于其他的光伏组件红外影像分类模型。通过级联多个ResPNet模型,取得了该数据集目前已知最高的12类光伏组件红外影像分类检测精度(85.9%)。  相似文献   

9.
针对海面目标检测模型难以应用在存储能力和计算能力较小的移动端的问题,提出一种基于改进YOLOv5的海面目标检测算法。采用轻量级提取网络ShuffleNetv2 Block作为YOLOv5网络的骨干部分,减少模型计算量和参数量;使用加权双向特征金字塔网络模块替换原特征融合网络模块,提高网络对不同尺度的特征提取能力;引入坐标注意力机制,提高模型检测精度。在海面目标数据集上进行实验,结果表明:与YOLOv5模型相比,改进模型的精确率、召回率、平均精度分别提高了1.2%、1.4%、0.9%,计算量和参数量分别降低了55.8%,54.9%。改进后的YOLOv5模型不仅提高了检测精度和模型性能,还压缩了模型的计算量和参数量,有利于部署在移动设备端。  相似文献   

10.
王超  吴亚锋 《电声技术》2007,31(11):52-54,60
音频自动分类是解决音频结构化问题和提取音频内容语义的重要手段之一,是当前基于内容的音频检索领域的一个研究热点。在考察音频数据特征的基础上,针对左-右密度隐马尔可夫模型(left-right DHMM)不能很好反映音频中状态反复的缺点,提出了一种基于各态历经混合高斯密度隐马尔可夫模型(EMGD_HMM)的分类器,并应用于语音、音乐和它们的混合声音的分类。实验结果表明,EMGD_HMM的分类精度要优于left-right DHMM。  相似文献   

11.
王琪  仝爽 《无线电工程》2023,(4):925-935
当前的睡眠阶段时空特征提取依赖于给定数据集标签的监督学习,在一定程度上受到限制。提出一种基于脑电信号的半监督睡眠分期算法,利用由改进卷积编码-解码器和生成对抗网络构建的浅层特征提取网络提取浅层时空特征,采用Hard swish激活函数来加速模型收敛。为充分提取脑电信号高质量的深层时序依赖特征,模型的深层特征提取网络将传统的长短时记忆网络改进为参数较少的双向门控循环单元。在特征融合后使用加权交叉熵损失函数训练以提高模型的分类准确性。实验使用Sleep-EDF数据集在Fpz-Cz通道上对模型进行20折交叉验证,得到模型总体准确率和MF1值分别为86.3%和81.2%,相比于卷积循环网络分别提高了3.1%和3.3%。  相似文献   

12.
细粒度图像具有不同子类间差异小、相同子类内差异大的特点。现有网络模型在处理过程中存在特征提取能力不足、特征表示冗余和归纳偏置能力弱等问题,因此提出一种改进的Transformer图像分类模型。首先,利用外部注意力取代原Transformer模型中的自注意力,通过捕获样本间相关性提升模型的特征提取能力;其次,引入特征选择模块筛选区分性特征,去除冗余信息,加强特征表示能力;最后,引入融合的多元损失,增强模型归纳偏置和区分不同子类、归并相同子类的能力。实验结果表明,所提方法在CUB-200-2011、Stanford Dogs和Stanford Cars三个细粒度图像数据集上的分类精度分别达89.8%、90.2%和94.7%,优于多个主流的细粒度图像分类方法,分类结果较好。  相似文献   

13.
为提升无人船航行环境中船舶目标的感知精度,提出一种基于细节增强的级联多分类船舶检测模型。首先,提出混合平移数据增强(pan-mixed data augmentation,PMDA)算法,减少模型对船舶整体轮廓的依赖;其次,设计可变卷积平衡特征金字塔(deformable convolution-balanced feature pyramid,DC-BFP),提高模型对船体细节特征的提取能力;再次,将全连接层和卷积层联合构成级联交叉检测器(cascaded cross detector,CCD),提高模型对船体细节特征的解析能力;最后,采用标签平滑正则化(label smoothing regularization,LSR) 方法,改善多分类检测的过拟合问题。在自建11分类光电船舶检测数据集MCSD11上进行消融和对比实验,特征提取结果和实验结果数据可视化表明,模型的各个改进部分能够提升船舶检测效果,平均精度达到了91.53%,相比主流的检测模型,算法得到大幅提升。  相似文献   

14.
蛋白质序列的不同特征提取方式对蛋白质结构分类有很大的影响。为更好地表达蛋白质结构信息,基于特征融合思想构建特征向量,并使用一种基于多核支持向量机的方法,以多个核函数的线性加权代替传统的单一核函数,在对多类特征进行整合后构造SimpleMKL分类模型;利用梯度下降法迭代求解核函数的权值系数,并校准核函数参数和不同特征表达的融合效果。实验结果表明,该方法提高了蛋白质二级结构分类精度,在分类精度方面有明显优势,有助于准确预测蛋白质的二级结构。  相似文献   

15.
冯玮  王玉德  张磊 《激光技术》2018,42(5):666-672
为了降低卷积神经网络计算的复杂度,改善特征提取过程中的过拟合现象,解决经典网络模型不能有效处理大尺寸图片的问题,采用了加权联合降维的特征融合与分类识别算法,根据两特征的识别贡献率对主成分分析法(PCA)降维处理和随机投影(RP)处理结果进行加权融合,然后将结果提供给卷积神经网络进行处理,提取图像分类的高层特征,使用欧氏距离分类器对识别对象进行分类,并进行了理论分析和实验验证。结果表明,经过加权联合降维对数据进行预处理,PCA矩阵与RP降维矩阵之比重达到6:4,识别率高达96%以上。该算法有效提高了准确率,使大尺寸图片在深度学习网络中有良好的识别效果,改善了网络的适应性。  相似文献   

16.
关世豪  杨桄  李豪  付严宇 《激光技术》2020,44(4):485-491
为了针对高光谱图像中空间信息与光谱信息的不同特性进行特征提取,提出一种3维卷积递归神经网络(3-D-CRNN)的高光谱图像分类方法。首先采用3维卷积神经网络提取目标像元的局部空间特征信息,然后利用双向循环神经网络对融合了局部空间信息的光谱数据进行训练,提取空谱联合特征,最后使用Softmax损失函数训练分类器实现分类。3-D-CRNN模型无需对高光谱图像进行复杂的预处理和后处理,可以实现端到端的训练,并且能够充分提取空间与光谱数据中的语义信息。结果表明,与其它基于深度学习的分类方法相比,本文中的方法在Pavia University与Indian Pines数据集上分别取得了99.94%和98.81%的总体分类精度,有效地提高了高光谱图像的分类精度与分类效果。该方法对高光谱图像的特征提取具有一定的启发意义。  相似文献   

17.
杨雅志  李骏 《红外与激光工程》2021,50(12):20210165-1-20210165-7
红外成像是夜间观测的重要手段,在军事民用领域都有着广泛运用。针对红外图像目标分类问题,将单演信号引入用于特征提取,用于对目标特性的分析。经过单演信号处理后的红外图像可用幅度、相位和方位三个成分描述。对于每一个成分的多尺度结果,采用矢量串接以及降采样结合的方式构建单一特征矢量。最终构造得到的三个特征矢量能够反映目标的多层次特性。采用联合稀疏表示作为三种单演信号特征矢量的表征模型。在重构过程中,充分利用三类特征之间的关联性从而提高整体重构精度。在不同类别上按照联合稀疏表示的求解结果计算对于测试样本的重构误差,进而决定测试样本的类别信息。该方法通过单演信号获取红外图像中目标的多层次特性,基于联合稀疏表示模型对这些特征进行充分分析和挖掘,从而提高目标分类的精度和稳健性。实验基于公开的中波红外(Medium wave infrared,MWIR)图像数据集开展,分别对原始样本、模拟噪声样本以及模拟遮挡样本进行分类。根据实验结果,并与几类现有算法对比,反映了所提方法对于红外图像目标分类问题能够取得更高的有效性和稳健性。  相似文献   

18.
针对多源遥感图像的差异性和互补性问题,该文提出一种基于空间与光谱注意力的光学图像和SAR图像特征融合分类方法。首先利用卷积神经网络分别进行光学图像和SAR图像的特征提取,设计空间注意力和光谱注意力组成的注意力模块分析特征重要程度,生成不同特征的权重进行特征融合增强,同时减弱对无效信息的关注,从而提高光学和SAR图像融合分类精度。通过在两组光学和SAR图像数据集上进行对比实验,结果表明所提方法取得更高的融合分类精度。  相似文献   

19.
现有以YOLOv5为代表的目标检测技术,存在骨干网络对特征提取不充分以及颈部层未高效融合浅层位置信息和深层高级语义信息等问题,这会导致检测精度较低,小目标误检、漏检。针对此问题,从兼顾实时性与检测精度出发,对YOLOv5进行改进,提出一种改进网络YOLOv5-CBGhost。首先在骨干网络中引入Ghost模块对模型进行轻量化处理,引入CA模块来更好地获得全局感受野,提高模型获取目标位置的准确度;然后借鉴双向加权特征金字塔网络,对原PAN结构进行改进,有效减少了特征冗余以及参数量,并通过跨层加权连接融合更多特征,提高了模型的目标检测精度;最后,增加多检测头以获取图片更丰富的高层语义信息,有效增加了检测精度。通过在PASCAL VOC2007+2012数据集上实验,YOLOv5-CBGhost的目标精度达到81.8%,相较于YOLOv5s,提高了3.0%,计算量减少42.5%,模型大小减少3.5%。  相似文献   

20.
针对深度学习中残差网络ResNet50存在的信息丢失、特征提取不充分、网络过拟合和训练困难等问题,文中提出一种基于改进ResNet50的图像分类算法。针对残差网络ResNet50在提取特征时存在丢失输入特征映射情况,造成信息丢失的问题,对主干网络中Stage4的下采样块添加平均池化层,进一步提高网络特征提取能力;针对ResNet50训练过程中存在网络过拟合以及泛化能力差的问题,使用标签平滑方法对交叉熵损失函数进行修改,有效缓解网络损失值震荡幅度;针对ResNet50计算量大、训练困难的问题,使用混合精度和余弦退火衰减方法对模型进行训练,在加快网络收敛速度的同时提高模型的分类精度。实验结果表明,与原ResNet50网络相比,文中算法在ImageNet-1k数据集上Top1和Top5的精度分别提升3.2%和1.6%,能够更好地应用于图像分类任务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号