首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出了一种基于参数迁移和卷积循环神经网络的语音情感识别模型。该模型把语谱图作为网络的输入,引入AlexNet网络模型并迁移其预训练的卷积层权重参数,将卷积神经网络输出的特征图重构后输入LSTM(Long Short-Term Memory)网络进行训练。实验结果表明,所提方法加快了网络训练的速度,并提高了情感识别的准确率。  相似文献   

2.
针对铜合金成分检测过程中产生的时滞问题,提出一种基于特征聚合的铜合金金相图分类识别方法。首先,在特征提取阶段,构建灰度共生矩阵(GLCM)和基于卷积注意力模块的残差网络(ResNet)模型分别提取图像的全局与局部特征;其次,在特征聚合阶段,将提取到的特征规范化后进行简单的级联;最后,在分类识别阶段,使用支持向量机(SVM)精确分类。实验结果表明,所提方法的准确率达到了98.963%、宏F1达到了98.996%,优于基于单特征的机器学习方法。可见,不同的方法提取的特征经过聚合后可以更全面地描述铜合金金相图的纹理及边缘信息,所提方法可以通过金相图识别不同铜合金,提升了识别的准确率,且具有良好的鲁棒性。  相似文献   

3.
杨明羽  叶春明 《计算机工程》2021,47(12):278-284
针对现有美式手语(ASL)识别算法准确率低和模型训练时间长的问题,提出一种结合双向二维主成分分析(Bi-2DPCA)与卷积神经网络(CNN)并基于贝叶斯优化的识别算法。利用Bi-2DPCA算法对原始图像做数据降维处理,提取行、列方向的特征图,使用卷积神经网络对特征图进行训练分类,同时采用贝叶斯优化算法对模型超参数进行自动调参。在24分类ASL数据集上的实验结果表明,该算法的识别准确率达到99.15%,训练时间相比传统CNN算法减少90.3%。  相似文献   

4.
针对传统故障监测方法对精密的健美操力量训练器故障监测精度低的问题,通过优化卷积神经网络随机梯度下降算法中的梯度下降方式和学习率,并将提取的训练器振动信号特征作为改进卷积神经网络输入,提出一种基于深度学习的健美操力量训练器故障监测方法。仿真结果表明,所提方法对卷积神经网络改进有效,利用改进的卷积神经网络可识别监测健美操力量训练器不同类型、不同位置和不同程度的故障,平均监测准确率达到97.75%,对训练器正常状态和4根转子断裂的轴承故障监测准确率达到100%。相较于改进前卷积神经网络,所提监测方法的监测准确率提高了7.50%,相较于常用故障监测算法,所提方法的监测准确率均有不同程度的提升,具有一定的有效性和优越性,并采用改进卷积神经网络进行分类识别,可有效监测。  相似文献   

5.
叶利华  王磊  赵利平 《计算机应用》2017,37(7):2008-2013
针对低小慢无人机野外飞行场景复杂自主降落场景识别问题,提出了一种融合局部金字塔特征和卷积神经网络学习特征的野外场景识别算法。首先,将场景分为4×4和8×8块的小场景,使用方向梯度直方图(HOG)算法提取所有块的场景特征,所有特征首尾连接得到具有空间金字塔特性的特征向量。其次,设计一个针对场景分类的深度卷积神经网络,采用调优训练方法得到卷积神经网络模型,并提取深度网络学习特征。最后,连接两个特征得到最终场景特征,并使用支持向量机(SVM)分类器进行分类。所提算法在Sports-8、Scene-15、Indoor-67以及自建数据集上较传统手工特征方法的识别准确率提高了4个百分点以上。实验结果表明,所提算法能有效提升降落场景识别准确率。  相似文献   

6.
针对现有算法自动识别颈部淋巴结效率不高、存在大量假阳性且整体假阳性去除效果不理想的问题,提出一种基于级联全卷积神经网络(FCN)的颈部淋巴结识别算法。首先,结合医生的先验知识采用级联FCN进行初步识别,即第一个FCN从头颈部计算机断层扫描图像(CT)中提取淋巴结医学分区;然后,第二个FCN从分区内提取候选样本并在三维层面合并这些样本以生成三维图像块;最后,将提出的特征块平均池化引入到三维分类网络中,对输入的不同尺度三维图像块进行二分类以去除假阳性。在颈部淋巴结数据集中,采用级联FCN识别颈部淋巴结的召回率可达97.23%;引入特征块平均池化的三维分类网络的分类准确率可达到98.7%。在去除假阳性之后的准确率可达93.26%。实验结果分析表明,所提算法能有效实现颈部淋巴结的自动识别并取得较高的召回率和准确率,优于目前相关文献报道的算法;且算法简单高效,易于扩展到其他三维医学图像的目标检测任务中。  相似文献   

7.
针对传统卷积神经网络在人脸表情识别过程中存在有效特征提取针对性不强、识别准确率不高的问题,提出一种基于多尺度特征注意力机制的人脸表情识别方法。用两层卷积层提取浅层特征信息;在Inception结构基础上并行加入空洞卷积,用来提取人脸表情的多尺度特征信息;引入通道注意力机制,提升模型对重要特征信息的表示能力;最后,将得到的特征输入Softmax层进行分类。通过在公开数据集FER2013和CK+上进行仿真实验,分别取得了68.8%和96.04%的识别准确率,结果表明该方法相比许多经典算法有更好的识别效果。  相似文献   

8.
孙敏  李旸  庄正飞  余大为 《计算机应用》2005,40(9):2543-2548
针对传统卷积神经网络(CNN)不仅会忽略词的上下文语义信息而且最大池化处理时会丢失大量特征信息的问题,传统循环神经网络(RNN)存在的信息记忆丢失和梯度弥散问题,和CNN和RNN都忽略了词对句子含义的重要程度的问题,提出一种并行混合网络融入注意力机制的模型。首先,将文本用Glove向量化;之后,通过嵌入层分别用CNN和双向门限循环神经网络提取不同特点的文本特征;然后,再把二者提取得到的特征进行融合,特征融合后接入注意力机制判断不同的词对句子含义的重要程度。在IMDB英文语料上进行多组对比实验,实验结果表明,所提模型在文本分类中的准确率达到91.46%而其F1-Measure达到91.36%。  相似文献   

9.
基于卷积神经网络的工控网络异常流量检测   总被引:1,自引:0,他引:1  
张艳升  李喜旺  李丹  杨华 《计算机应用》2019,39(5):1512-1517
针对工控系统中传统的异常流量检测模型在识别异常上准确率不高的问题,提出一种基于卷积神经网络(CNN)的异常流量检测模型。该模型以卷积神经网络算法为核心,主要由1个卷积层、1个全连接层、1个dropout层以及1个输出层构成。首先,将实际采集的网络流量特征数值规约到与灰度图像素值相对应的范围内,生成网络流量灰度图;然后,将生成好的网络流量灰度图输入到设计好的卷积神经网络结构中进行训练和模型调优;最后,将训练好的模型用于工控网络异常流量检测。实验结果表明,所提模型识别精度达到97.88%,且与已有的精度最高反向传播(BP)神经网络测精度提高了5个百分点。  相似文献   

10.
人脸表情是人类内心情绪最真实最直观的表达方式之一,不同的表情之间具有细微的类间差异信息。因此,提取表征能力较强的特征成为表情识别的关键问题。为提取较为高级的语义特征,在残差网络(ResNet)的基础上提出一种注意力金字塔卷积残差网络模型(APRNET50)。该模型融合金字塔卷积模块、通道注意力和空间注意力。首先用金字塔卷积提取图像的细节特征信息,然后对所提特征在通道和空间维度上分配权重,按权重大小定位显著区域,最后通过全连接层构建分类器对表情进行分类。以端到端的方式进行训练,使得所提网络模型更适合于精细的面部表情分类。实验结果表明,在FER2013和CK+数据集上识别准确率可以达到73.001%和94.949%,与现有的方法相比识别准确率分别提高了2.091个百分点和0.279个百分点,达到了具有相对竞争力的效果。  相似文献   

11.
进口木材蛀虫检疫是海关的一项重要工作,但其存在着虫声检测算法准确率低、鲁棒性差等问题。针对这些问题,提出了一种基于三维卷积神经网络(3D CNN)的虫音检测方法以实现虫音特征的识别。首先,对原始虫音音频进行交叠分帧预处理,并使用短时傅里叶变换得到虫音音频的语谱图;然后,将语谱图作为3D CNN的输入,使其通过包含三层卷积层的3D CNN以判断音频中是否存在虫音特征。通过设置不同分帧长度下的输入进行网络训练及测试;最后以准确率、F1分数以及ROC曲线作为评估指标进行性能分析。结果表明,在交叠分帧长度取5 s时,训练及测试效果最佳。此时,3D CNN模型在测试集上的准确率达到96.0%,F1分数为0.96,且比二维卷积神经网络(2D CNN)模型准确率提高近18%。说明所提算法能准确地从音频信号中提取虫音特征并完成蛀虫识别任务,为海关检验检疫提供有力保障。  相似文献   

12.
胡章芳  张力  黄丽嘉  罗元 《计算机应用》2019,39(8):2480-2483
针对目前运动想象脑电(EEG)信号识别率较低的问题,考虑到脑电信号蕴含着丰富的时频信息,提出一种基于时频域的卷积神经网络(CNN)运动想象脑电信号识别方法。首先,利用短时傅里叶变换(STFT)对脑电信号的相关频带进行预处理,并将多个电极的时频图组合构造出一种二维时频图;然后,针对二维时频图的时频特性,通过一维卷积的方法设计了一种新颖的CNN结构;最后,通过支持向量机(SVM)对CNN提取的特征进行分类。基于BCI数据集的实验结果表明,所提方法的平均识别率为86.5%,优于其他传统运动想象脑电信号识别方法;同时将该方法应用在智能轮椅上,验证了其有效性。  相似文献   

13.
为进一步提升语音测谎性能,提出了一种基于去噪自编码器(DAE)和长短时记忆(LSTM)网络的语音测谎算法。首先,该算法构建了优化后的DAE和LSTM的并行结构PDL;然后,提取出语音中的人工特征并输入DAE以获取更具鲁棒性的特征,同时,将语音加窗分帧后提取出的Mel谱逐帧输入到LSTM进行帧级深度特征的学习;最后,将这两种特征通过全连接层及批归一化处理后实现融合,使用softmax分类器进行谎言识别。CSC(Columbia-SRI-Colorado)库和自建语料库上的实验结果显示,融合特征分类的识别准确率分别为65.18%和68.04%,相比其他对比算法的识别准确率最高分别提升了5.56%和7.22%,表明所提算法可以有效提高谎言识别精度。  相似文献   

14.
动态情感特征是说话人独立语音情感识别中的重要特征。由于缺乏对语音中时频信息的充分挖掘,现有动态情感特征表征能力有限。为更好地提取语音中的动态情感特征,提出一种动态卷积递归神经网络语音情感识别模型。基于动态卷积理论构建一种动态卷积神经网络提取语谱图中的全局动态情感信息,使用注意力机制分别从时间和频率维度对特征图关键情感区域进行强化表示,同时利用双向长短期记忆网络对谱图进行逐帧学习,提取动态帧级特征及情感的时序依赖关系。在此基础上,利用最大密度散度损失对齐新个体特征与训练集特征分布,降低个体差异性对特征分布产生的影响,提升模型表征能力。实验结果表明,该模型在CASIA中文情感语料库、Emo-db德文情感语料库及IEMOCAP英文情感语料库上分别取得59.50%、88.01%及66.90%的加权平均精度,相较HuWSF、CB-SER、RNN-Att等其他主流模型识别精度分别提升1.25~16.00、0.71~2.26及2.16~8.10个百分点,验证了所提模型的有效性。  相似文献   

15.
杨亚楠  夏斌  赵磊  袁文浩 《计算机应用》2019,39(5):1421-1424
针对非视距(NLOS)状态鉴别需要已知信道类型的分类的问题,提出了一种基于卷积神经网络(CNN)的信道环境分类算法。首先,对超宽带(UWB)信道进行采样,构建样本集合;然后,利用样本集合训练CNN,对不同的信道场景特征进行提取;最终实现超宽带信道环境的分类。实验结果表明:所采用的分类方法的总模型准确率约为93.40%,能有效地实现信道环境的分类识别。  相似文献   

16.
针对生理信号情感识别问题,提出一种基于图神经网络(GNN)和注意力的双模态情感识别方法。首先,使用GNN对脑电(EEG)信号进行分类;然后,使用基于注意力的双向长短期记忆(Bi-LSTM)网络对心电(ECG)信号进行分类;最后,通过Dempster-Shafer证据理论融合EGG和ECG分类结果,从而提高情感识别任务的综合性能。为验证所提方法的有效性,邀请20名受试者参与情感激发实验,并收集了受试者的EGG、ECG信号。实验结果表明,所提方法的二分类准确率在valence维度和arousal维度分别为91.82%和88.24%,相较于单模态EEG方法分别提高2.65%和0.40%,相较于单模态ECG方法分别提高19.79%和24.90%。可见,所提方法能够有效地提高情感识别的准确率,为医疗诊断等领域提供决策支持。  相似文献   

17.
学生的学习情况与其课堂注意力状态密切相关。为了探寻注意力训练能否提高课堂注意力,对10名在校学生进行了α音乐训练,并收集了训练前后的非注意和注意状态的脑电(Electroence-phalogram,EEG)信号进行对比研究。由于EEG信号本质上是动态的,且具有低信噪比和高冗余度的特性,为避免直接通过神经网络识别EEG信号效果差的问题,提取了信号的样本熵(Sample entropy,SampEn)、各个波段的能量和能量比共11个特征,并将这些特征进行融合转化为多特征图像,作为神经网络模型的输入。此外,将AlexNet和VGG11两个网络模型进行加权融合构成双卷积神经网络,进一步提高了图像分类性能。结果表明,与单个模型相比,双卷积神经网络融合模型的性能更佳,其识别准确率最高可达到97.53%。研究发现,经过α音乐训练,受试者的脑电特征与此前相比有显著性差异,且网络模型的分类准确率比训练前提高了4%,说明本文所提的α音乐训练能够提高健康学生的注意力水平。  相似文献   

18.
针对现有的变电站缺陷图像检测识别算法鲁棒性弱问题,提出一种基于注意力机制学习的变电设备缺陷图像检测识别方法。所提方法以卷积神经网络作为缺陷图像特征提取的骨架网络,融合注意力机制原理,进一步提升缺陷图像特征的可辨识性。首先,构建注意力机制的卷积神经网络特征提取模型,提取不同注意力机制下变电站缺陷图像特征;其次,设计一种自适应特征学习函数,将不同注意力机制下的特征融合成为新的高质量变电缺陷图像特征;最后,将不同注意力机制下的缺陷图像特征输入到分类模型,实现变电站缺陷图像检测。所提方法增强了变电设备缺陷图像检测的准确性与鲁棒性,实验结果显示,所提方法的mAP达到了70.4%。  相似文献   

19.
陈郑淏  冯翱  何嘉 《计算机应用》2019,39(7):1936-1941
针对情感分类中传统二维卷积模型对特征语义信息的损耗以及时序特征表达能力匮乏的问题,提出了一种基于一维卷积神经网络(CNN)和循环神经网络(RNN)的混合模型。首先,使用一维卷积替换二维卷积以保留更丰富的局部语义特征;再由池化层降维后进入循环神经网络层,整合特征之间的时序关系;最后,经过softmax层实现情感分类。在多个标准英文数据集上的实验结果表明,所提模型在SST和MR数据集上的分类准确率与传统统计方法和端到端深度学习方法相比有1至3个百分点的提升,而对网络各组成部分的分析验证了一维卷积和循环神经网络的引入有助于提升分类准确率。  相似文献   

20.
陈立潮  张雷  曹建芳  张睿 《计算机应用》2005,40(10):2881-2889
为了充分利用图像信息以提高现有交通监控下车型分类的效果,在胶囊网络的基础上增加梯度直方图卷积(HOG-C)特征提取方法,提出HOG-C特征的胶囊网络模型——HOG-C CapsNet。首先,使用梯度统计特征提取层对图像中的梯度信息进行统计,构建方向梯度直方图(HOG)特征图;其次,使用卷积层提取出图像的颜色信息,把提取出的颜色信息与HOG特征图融合构成HOG-C特征图;最后,输入卷积层提取HOG-C特征图的抽象特征,并通过胶囊网络对提取的抽象特征进行具有三维空间特征表达的胶囊封装,使用动态路由算法实现车型分类。在BIT-Vehicle数据集上对该模型和其他相关模型进行的对比实验中,该模型得到98.17%的准确率、97.98%的平均精确率均值(MAP)、98.42%的平均召回率均值(MAR)和98.20%的综合评价指标。实验结果表明,该模型在交通监控下的车型分类上具有更好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号