共查询到19条相似文献,搜索用时 62 毫秒
1.
在频域语音增强算法中,由于估计幅度谱与带噪相位谱的不匹配,其性能难以突破固有上限。在时域语音增强框架中,模型将时域波形作为输入,由网络直接学习时域波形之间的映射关系,有效地避免了无效短时傅里叶变换(STFT)问题。然而,常见的采用波形最小均方误差的时域语音增强算法对语音频域特征的建模并未达到最优。针对这个问题,提出一种基于时频联合损失函数的语音增强算法。首先将时频联合损失函数应用到Wave-U-Net时域语音增强网络,同时设计并分析了一阶范数形式和二阶范数形式的时频联合损失函数对增强网络的影响,最后得到了面向语音通信任务和语音识别任务的相对最佳损失函数选择方案。实验结果表明,相较于采用时域损失的增强网络,采用面向语音通信时最佳联合损失函数的增强网络在语音质量的感知评估(PESQ)和短时目标清晰度(STOI)分别实现了3.6%和2.30%的相对提升,采用面向语音识别时最佳联合损失函数的增强网络在字符错误率(CER)上实现了1.82%的相对降低。相较于Wave-U-Net时域语音增强网络,该算法有更好的噪声抑制效果,在后端语音识别任务中表现更为优秀。 相似文献
2.
针对现有的步态识别模型识别准确率不够高、提取特征层次较浅等问题,在步态识别网络GaitSet的基础上,提出一种新的基于改进残差网络的联合损失步态特征识别模型Res-GaitSet。步态作为一种独特而有效的远距离识别生物特征,可以在老年医学评估、社会秩序保障等方面被广泛应用。新网络在特征提取模块中引入残差单元,并采用多个损失函数联合使用的方式,此方法可有效提高步态识别模型的准确性和鲁棒性。实验结果表明,改进后的网络Res-GaitSet在CASIA-B数据集的多个场景和不同识别角度下的准确率均有提升。同时,将改进后的网络用于自建步态数据集,对比于原网络,改进后的网络识别效果在不同角度下也均有提升,充分验证了改进模型的有效性。 相似文献
3.
针对公共安全场所中如何通过非接触性的方法识别犯罪可疑分子,成为目前研究的热点之一,其中步态识别技术在公安视频侦查工作中具有良好的应用前景。现阶段,步态识别技术在公开数据集CASIA-B的正常行走状态下识别正确率已经达到了96%,但是行人在穿外套和携带包裹等有遮挡行走状态下的识别正确率效果不太理想。针对此问题,采用联合Triplet和Softmax两个损失函数的方法,同时在联合损失函数中加入L2正则化,从而优化网络步态模型,通过训练提高行人的步态识别准确率。研究结果表明,正常行走条件下的步态识别准确率维持在合理范围内,穿外套和携带包裹行走的步态识别准确率均有明显的提升,分别提升至93.03%和81.03%。 相似文献
4.
海面目标监测时,舰船目标的清晰度常随着不同的日照强度下海面光线反射强度而变化,不同的日照强度会导致舰船目标识别率不稳定,出现误判虚警率提高等问题.为此,提出基于ResNet-50的舰船目标识别算法.首先使用ResNet-50网络提取图像特征信息,并对日照强度变化前后的特征进行日照鲁棒损失约束,减小特征差异;然后采用灰度直方图计算特征统计矩的方法得到日照对比度、亮度、平滑度、信息量、三阶矩和熵6种特征,并生成新的特征向量对日照强度前后的特征再次进行日照鲁棒损失约束,削弱和约束日照变化前后亮度、对比度因素对特征的影响;最后将二者约束联合构成损失函数并进行训练,使用贝叶斯自适应超参数优化训练最佳权重.实验结果表明,针对舰船日照变化数据库的平均识别率达到90.47%,比改进前提高4.00%左右,对日照强度为25,65和80的舰船图像识别率分别提高3.14%,6.07%和16.41%,该算法对日照强度变化有着良好的约束作用,显著提升了识别率. 相似文献
5.
为了便于管理猪只,需及时关注每只猪的状态,本研究以真实条件下的7只猪只为研究对象,利用Keras建立了卷积层-池化层-卷积层-池化层2层卷积神经网络模型对猪只个体身份进行识别.建立的卷积神经网络模型对猪只个体身份识别的准确率可达85.71%.建立的猪只个体身份识别模型简单,执行效率高,可以较准确的实现猪只身份识别. 相似文献
6.
目前基于卷积神经网络的表情识别方法提取的人脸表情特征存在类内差异大、类间差异小的特点,常用的损失函数在上述特点中难以有效分类。针对该问题,提出采用ResNet-18网络的人脸表情识别方法,研究基于CenterLoss、SphereFace、CosFace和ArcFace等不同损失函数在人脸表情识别中的性能。在此基础上,基于集成学习原理构建基于多个损失函数集成的ResNet-EnLoss网络,以减小人脸表情特征的类内差异、增大类间差异,提高表情识别准确率。实验结果表明,ResNet-EnLoss网络在FER2013数据集上取得了74.03%的识别准确率,网络泛化能力强、稳定性好,且识别准确率显著高于文献已有结果。 相似文献
7.
使用毫米波雷达进行非接触式生命特征监测能进行持续且较难察觉的身份识别。由于心脏运动受各种复杂因素影响,为捕获更具特征的波形信息,本文利用发射调频连续波的毫米波雷达对用户睡眠时的心脏数据进行监测和捕获。此外,本文提出一种基于心脏运动一维时序雷达信号的深度卷积神经网络身份识别方法,并与长短期记忆网络、InceptionTime和LSTformer这3种深度学习算法进行了性能对比分析。在实验室采集的人体静卧状态下的心脏信号数据集上,各模型的最终分类准确率均大于85%。其中,深度卷积神经网络InceptionTime的准确率最高,但耗时最长;长短期记忆网络模型和LSTformer的准确率较低,但耗时较短;本文提出的卷积神经网络模型的准确率与InceptionTime相当,但计算耗时较短,在准确率和计算效率之间取得了平衡。 相似文献
8.
深度学习网络是计算机视觉和人工智能系统的研究热点之一,行人属性识别提供了结构化的行人特征,为安防计算机视觉识别中行人检索提供了重要的信息.基于深度学习网络,提出了一种端到端的多属性识别方法,在R*CNN的基础上设计了一个端到端的行人属性识别网络,使用候选区域提取网络代替Selective Search提取第二重要的区域,建立属性识别与辅助区域提取一体化的网络,提升局部及细节属性识别的准确率;其次,为增加辅助区域的作用,将人体感兴趣区域按比例划分为整体、头、肩膀到腰及腰到脚4个部分,每个部分对应了不同属性,在任务分支层分出4个分支,使用主要区域预测对应属性的同时,分别从RPN中学习到对应的第二重要区域辅助预测;最后,提出了基于损失梯度的损失权值自动更新方法,即权重与损失的梯度逆相关,防止某个任务训练的过快或过慢.通过在行人属性数据库进行实验,整体提升了属性预测的准确率,大大缩短了识别时间. 相似文献
9.
自动调制识别技术不仅可以提高频谱资源的利用率,而且是有效鉴别用户合法身份的方式之一。为进一步提高识别算法的性能,文章考虑幅度和相位特征之间的联系,提出了一种新的非对称多通道联合学习网络。该网络将幅度、相位以及两者的联合矩阵作为多通道输入端,在不改变参数量和计算速度的前提下利用非对称联合学习模块,较好地提取调制信号的幅度和相位中同质和异构特征,来实现自适应调制编码。实验结果表明,与其他深度学习网络相比,文章所提网络在基准开源数据集RadioML2016.10a和RadioML2016.10b上分别实现了91.73%和93.36%的识别精度。 相似文献
10.
11.
李博 《计算机工程与应用》2021,57(10):110-116
跨镜行人追踪是计算机视觉和视频监控公共安全体系构建等领域的重要课题.伴随大规模数据集的发展和深度学习网络的广泛研究,深度学习在跨镜行人追踪问题中取得了良好效果.然而在应用中,除了监控视频自身的不同摄像头、不同视角引起的不同视觉表象变化外,面向跨镜行人追踪的整体数据集偏小,具有标记的训练数据样本量更小,从而制约了基于深度... 相似文献
12.
目的 人脸超分辨率重建是特定应用领域的超分辨率问题,为了充分利用面部先验知识,提出一种基于多任务联合学习的深度人脸超分辨率重建算法。方法 首先使用残差学习和对称式跨层连接网络提取低分辨率人脸的多层次特征,根据不同任务的学习难易程度设置损失权重和损失阈值,对网络进行多属性联合学习训练。然后使用感知损失函数衡量HR(high-resolution)图像与SR(super-resolution)图像在语义层面的差距,并论证感知损失在提高人脸语义信息重建效果方面的有效性。最后对人脸属性数据集进行增强,在此基础上进行联合多任务学习,以获得视觉感知效果更加真实的超分辨率结果。结果 使用峰值信噪比(PSNR)和结构相似度(SSIM)两个客观评价标准对实验结果进行评价,并与其他主流方法进行对比。实验结果显示,在人脸属性数据集(CelebA)上,在放大8倍时,与通用超分辨率MemNet(persistent memory network)算法和人脸超分辨率FSRNet(end-to-end learning face super-resolution network)算法相比,本文算法的PSNR分别提升约2.15 dB和1.2 dB。结论 实验数据与效果图表明本文算法可以更好地利用人脸先验知识,产生在视觉感知上更加真实和清晰的人脸边缘和纹理细节。 相似文献
13.
二维人脸识别受光照、遮挡和姿态的影响较大.为了克服二维人脸识别的缺点,本文提出了一种基于深度学习的多模态融合三维人脸识别算法.该方法首先使用卷积自编码器将彩色图像和深度图进行融合,将融合后的图像作为网络的输入进行预训练,并且设计了一种新的损失函数cluster loss,结合Softmax损失,预训练了一个精度非常高的模型.之后使用迁移学习将预训练的模型进行微调,得到了一个轻量级神经网络模型.将原始数据集进行一系列处理,使用处理之后的数据集作为测试集,测试的识别准确率为96.37%.实验证明,该方法弥补了二维人脸识别的一些缺点,受光照和遮挡的影响非常小,并且相对于使用高精度三维人脸图像的三维人脸识别,本文提出的算法速度快,并且鲁棒性高. 相似文献
14.
针对单目3D目标检测网络训练约束少、模型预测精度低的问题,通过网络结构改进、透视投影约束建立以及损失函数优化等步骤,提出了一种基于透视投影的单目3D目标检测网络.首先,在透视投影机理的基础上,利用世界、相机以及目标三者之间的变换关系,建立一种利用消失点(VP)求解3D目标边界框的模型;其次,运用空间几何关系和先验尺寸信息,将其简化为方位角、目标尺寸与3D边界框的约束关系;最后,根据尺寸约束的单峰、易回归优势,进一步提出一种学习型的方位角―尺寸的损失函数,提高了网络的学习效率和预测精度.在模型训练中,针对单目3D目标检测网络未约束3D中心的缺陷,基于3D边界框和2D边框的空间几何关系,提出联合约束方位角、尺寸、3D中心的训练策略.在KITTI和SUN-RGBD数据集上进行实验验证,结果显示本文算法能获得更准确的目标检测结果,表明在3D目标检测方面该方法比其他算法更有效. 相似文献
15.
16.
找到能减小类内距离、增大类间距离的特征表示方法是行人识别的一个挑战。提出一种基于行人验证和识别相融合的深度网络模型来解决这一问题。首先,识别监督学习网络模型增加不同个人的类间间距,验证监督学习网络模型减少同一个行人的类内间距;然后,将行人验证和识别的深度网络融合,提取到更有分辨能力的行人特征向量;最后,采用了联合贝叶斯的行人比对方法,通过监督学习排名的方式,提高行人比对的准确率。实验结果表明,所提方法在VIPeR库上同其他深度网络相比有较高的识别准确率,融合网络与单独的识别和验证网络相比有更高的收敛速度和识别准确率。 相似文献
17.
在图像分割任务中,损失函数的选择直接影响模型的收敛过程和最终精度.交叉熵损失函数(cross-entropy loss,CEL)具有稳定的收敛性,但在面临数据分布不均衡的情况下精度较低.Dice损失函数(Dice loss,DL)通过区域面积计算,在处理不均衡数据时能够获得较高的精度,但在多类别数据集上难以训练.为了解决这些问题,提出了一种的交叉熵损失函数(Dice cross-entropy loss,DCEL),它对正样本使用交叉熵计算损失值,而对负样本使用交叉熵与交并比(IOU)的乘积计算损失值.这样设计使得DCEL在多类别数据集上梯度与误差正相关,有利于模型的收敛性,并通过压缩负样本损失值提升对正样本的关注度,从而提升了图像分割算法的精度.DCEL的性能在ADE20k、PASCAL VOC、LoveDA和HRF数据集上进行了验证. 相似文献
18.
针对基于传统深度神经网络的自然场景文本检测存在检测效果较差、文本边界框检测不准确等缺陷,提出基于损失函数融合的深度神经网络.将损失函数Balanced loss,利用加权的方法与传统深度神经网络进行融合,用于提高文本框边界区域及图像中难检测像素点的损失值,从而约束模型的优化方向,提升模型学习复杂特征的能力.实验结果表明... 相似文献
19.
为解决架空输电线路运行过程中因设备及杆塔上鸟巢对输电线路造成的不良影响,本文通过对比分析一阶目标检测模型和二阶目标检测模型的优劣,选取以分类损失函数为核心、特征金字塔网络为骨干网络的RetinaNet模型用于鸟巢目标的自动检测。解决了经典的一阶目标检测模型和二阶目标检测模型对鸟巢的检测效率或准确率比较低的问题。本文实验首先通过数据集选取及数据集预处理,并经过模型训练逐步优化调整网络结构和参数,建立了适合鸟巢检测的RetinaNet模型,实现对鸟巢的快速准确检测。实验结果表明,RetinaNet模型对输电线路的鸟巢的的平均准确率为94.1%,每张图片的识别速度为68ms,通过与Faster R-CNN、YOLO及SSD方法进行比较,验证了RetinaNet模型对输电线路设备及杆塔上鸟巢检测的有效性和可靠性。 相似文献