共查询到17条相似文献,搜索用时 78 毫秒
1.
2.
3.
韩向阳 《自动化与仪器仪表》2023,(7):201-204+209
为提高中文语音识别系统的识别准确率,研究在卷积神经网络的基础上提出了一种中文语音识别人机交互系统。在该系统中的声学模型中融入了残差网络和maxout函数,以此提高声学模型的性能。对研究提出的基于链接时序分类准则的深度卷积网络模型进行性能对比发现,该模型的绝对误差值为3.6%,低于其他对比模型。该结果说明,优化后的CTC-DCNN(maxout)模型的识别性能更好。故利用该模型作为中文语音识别系统的声学模型可以有效地提高系统的识别准确率,保证其人机互动的准确性,为中文语音识别领域提供新的方法。 相似文献
4.
针对遥感影像中道路信息容易受到建筑物、植被等非道路信息干扰的问题,提出了一种基于门控卷积残差网络的遥感影像道路提取模型.首先,该网络使用ResNet101作为网络的编码器,在使得网络足够深的同时,也保证了梯度信息的有效传导;其次,在中心部分使用ASPP多尺度特征提取模块,进一步挖掘特征图中给予的信息;最后,使用门控卷积替换普通的卷积层,它可以根据特征图中参数的重要性,自适应分配权重,作为网络的解码器部分.该方法在CVPR DeepGlobe 2018道路提取挑战赛的数据集上进行了验证,平均交并比、Dice相似系数、召回率分别达到70.20%、82.06%、82.21%,均超过该赛事冠军DlinkNet34,提升了道路提取的效果. 相似文献
5.
6.
为了构建高效的语音情感识别模型,充分利用不同情感特征所包含的信息,将语谱图特征和LLDs特征相结合,构建了一种基于自注意力机制的双通道卷积门控循环网络模型。同时,为了解决交叉熵损失函数无法增大语音情感特征类内紧凑性和类间分离性的问题,结合一致性相关系数提出新的损失函数——一致性相关损失(CCC-Loss)。将语谱图和LLDs特征分别输入CGRU模型提取深层特征并引入自注意力机制为关键时刻赋予更高的权重;使用CCC-Loss与交叉熵损失共同训练模型,CCC-Loss将不同类情感样本的一致性相关系数之和与同类情感样本的一致性相关系数之和的比值作为损失项,改善了样本特征的类内类间相关性,提高了模型的特征判别能力;将两个网络的分类结果进行决策层融合。所提出的方法在EMODB、RAVDESS以及CASIA数据库上分别取得了92.90%、88.54%以及90.58%的识别结果,相比于ACRNN、DSCNN等基线模型识别效果更好。 相似文献
7.
针对工业互联网攻击流量特征复杂以及深层神经网络易发生退化的问题,提出了一种基于残差网络和深度学习的入侵检测方法,实现了将一维卷积神经网络与门控循环单元残差连接的网络模型。使用CSE-CIC-IDS2018数据集和密西西比州大学的天然气管道数据集进行实验,结果表明,此方法在各个评价指标上均优于其他经典机器学习算法,具有较好检测性能和泛化能力,证明了其在工业网络环境中的可靠性及应用价值。 相似文献
8.
9.
针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+GPU计算模型在性耗比上更加优异。针对在卷积神经网络中Swish激活函数在反向传播求导误差梯度时涉及参数较多所导致的计算量较大,收敛速度慢,以及ReLU激活函数在[x]负区间内导数为零所导致的负梯度被置为零且神经元可能无法被激活的问题,提出了新的激活函数ReLU-Swish。通过测试训练对比并分析结果,将Swish激活函数小于零与ReLU激活函数大于零的部分组成分段函数,并且通过CIFAR-10和MNIST两个数据集进行测试对比实验。实验结果表明,ReLU-Swish激活函数在收敛速度以及模型测试训练的准确率上对比Swish激活函数及ReLU激活函数有较明显的提高。 相似文献
10.
11.
随着人工智能的发展,文字识别技术一方面有助于存储文本信息,一方面有助于机器对文本内容理解。文字识别技术在不断改进的同时,也被寄予更高的要求。相对于传统字符识别,一种序列文字识别方法将会更有效。因此,提出一种基于深度学习的端到端序列文字识别方法。为提取序列文本中的信息,也考虑到深度学习的运算量和运算资源,序列文本中的时序信息使用GRU网络提取,有效利用了文本中的时序关系。通过该方法,获得了非常好的识别效果。 相似文献
12.
针对深度卷积神经网络随着卷积层数增加而导致网络模型难以训练和性能退化等问题,提出了一种基于深度残差网络的人脸表情识别方法。该方法利用残差学习单元来改善深度卷积神经网络模型训练寻优的过程,减少模型收敛的时间开销。此外,为了提高网络模型的泛化能力,从KDEF和CK+两种表情数据集上选取表情图像样本组成混合数据集用以训练网络。在混合数据集上采用十折(10-fold)交叉验证方法进行了实验,比较了不同深度的带有残差学习单元的残差网络与不带残差学习单元的常规卷积神经网络的表情识别准确率。当采用74层的深度残差网络时,可以获得90.79%的平均识别准确率。实验结果表明采用残差学习单元构建的深度残差网络可以解决网络深度和模型收敛性之间的矛盾,并能提升表情识别的准确率。 相似文献
13.
基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语音盲增强的效率。该模型借助卷积网络参数量小、特征提取能力强等优点,在语谱图频率维度引入卷积结构,从而深入挖掘时频结构的细节和高低频信息间的关联关系以提取新型特征,并将此新型特征输入改进后的长短时记忆网络中,用于恢复高频成分信息并重构语音信号。通过在骨导语音数据库上实验,表明所提模型可以有效改善高频成分的时频结构,在提升增强效果的同时,降低了模型体积和推理的计算复杂度。 相似文献
14.
人上皮细胞(HEp-2)检测抗核抗体是诊断自身免疫性疾病的常用方法,HEp-2细胞图像识别对许多自身免疫性疾病的诊疗具有重要意义。针对目前主要采用手工评估方法造成效率低效、劳动强度高等问题,提出一种基于深度残差收缩网络的HEp-2细胞图像分类模型。该模型在深度残差网络基础上进行改进,残差学习模块使用恒等映射方法可以训练更深层次的网络。在每个残差学习模块内部嵌入一个软阈值非线性变换子网络,软阈值用以消除数据中的噪声和冗余信息,这些阈值通过子网络自动学习。实验表明,该方法具有良好的性能,优于其他深度神经网络方法。 相似文献
15.
传统的卷积神经网络用到的方法是在稀疏表示的超分辨率图像的基础上学习高/低分辨率图像之间端到端的映射,输入的是高分辨率的图像,输出的是低分辨率的图像,拥有三层卷积层的SRCNN虽然有一定的重建效果,但是感受野较低,因此,提出加深网络结构的方法,此次改进使得后面的网络层拥有更大的感受野,这样结果的像素点可以根据更多的像素点来推断。但是考虑到网络结构加深对传输速率的影响,通过引入局部残差学习和全局残差学习相结合的方法来提高学习率,通过该办法有效地加快了收敛速度,并且通过实验结果验证,与已有的Bicubic、SRCNN和VDSR相比,重建效果在峰值信噪比、结构相似性和视觉效果上均有所提升。 相似文献
16.
随着人工智能的火热发展,深度学习已经在很多领域占有了一席之地.作为深度学习中一个典型网络--残差神经网络模型自提出之日起就成为了众多研究者的关注点.然而,残差神经网络还有很大的改进空间.为了更好地解决反向传播中梯度减小的问题,本文提出了一种改进的残差神经网络,称为全卷积多并联残差神经网络.在该网络中,每一层的特征信息不仅传输到下一层还输出到最后的平均池化层.为了测试该网络的性能,分别在三个数据集(MNIST,CIFAR-10和CIFAR-100)上对比图像分类的结果.实验结果表明,改进后的全卷积多并联残差神经网络与残差网络相比具有更高的分类准确率和更好的泛化能力. 相似文献
17.