首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 234 毫秒
1.
针对传统的语音增强网络对未知噪声增强效果不理想的问题,本文从语谱图增强,网络结构,特征融合机制三方面提出改进方法。首先为了提取语谱图深层特征信息,使用VGG19结构来代替UNet结构中编码器部分,同时在解码器部分加入残差网络以加深网络深度,防止训练退化;其次,为了更好地结合语谱图中特征信息,在UNet结构跳跃连接部分加入自适应特征融合机制来融合深浅层特征。此外,为增强说话人信息,通过直方图均衡算法对语谱图进行特征优化,得到直方图均衡化增强后的语谱图。在不同的噪声环境中,本文所提方法在质量和可理解性度量方面评分都优于其他增强方法。  相似文献   

2.
针对强噪声、跨工况场景下数据分布差异导致传统卷积神经网络(CNN) 模型泛化性能低、诊断能力不足的问题,提出 一种基于并行卷积核和通道注意力机制的滚动轴承故障诊断方法。构造了带有不同尺度卷积核的并行网络结构,可以在抑 制噪声干扰的同时有效提取出数据中的故障特征信息;融合通道注意力机制对卷积层特征提取能力进行增强,提升模型抗噪 性能以及跨工况负载下的自适应诊断能力。利用凯斯西储大学轴承数据集训练并测试诊断效果,将该方法与其他方法进行 了性能对比。结果表明,在跨工况不同负载情况下,所提方法的诊断平均准确率为97.3%,在不同信噪比噪声干扰情况下的 诊断精度平均达93.8%,均高于其他比较方法,所提出的方法在复杂多变工况下具有良好的抗噪性能和泛化能力。  相似文献   

3.
针对水下目标检测中目标对比度低以及水下图像多尺度问题,提出了高频增强网络与特征金字塔(FPN)融合的水下目标检测算法,以提高对水下目标边缘、轮廓信息以及目标底层信息的提取。首先引入八度卷积将卷积层的输出特征按频率分解,将主干网络提取到的特征图进行高、低频信息分离,鉴于水下目标的轮廓信息和噪声信息均包含于高频特征中,在高频信息通道中引入通道信息具有自适应增强特点的通道注意力机制,形成了一种高频增强卷积,以达到增强有用轮廓特征信息和抑制噪声的目的;其次,将增强的高频特征分量融入FPN的浅层网络中,提高原FPN对水下多尺度目标的特征表示能力,缓解多尺度目标漏检问题。最后,将所提方法与基线算法Faster R-CNN融合,在全国水下机器人大赛提供的数据集中进行实验。结果表明:改进算法识别准确率达到78.83%,相比基线提升2.61%,与其他类型目标检测算法相比,依然具备精度和实时检测优势,证明了从特征图频域角度提升前景和背景对比度的有效性。  相似文献   

4.
在进行混合语音分离时,信号时域特征的深度学习语音分离性能优于频域特征。但目前时域特征的语音分离方法在真实噪声环境下的鲁棒性较差,且单一时域特征对分离模型的性能存在局限性。因此,提出一种基于Conv-TasNet网络的多特征语音分离方法,融合频域特征与时域特征,提高数据的多维信息。为了进一步提高分离网络性能,引入多尺度卷积块,提高网络对特征的提取能力。在包含真实噪声的实验环境下,所提方法与Conv-TasNet模型和最新的时频域融合语音分离基线模型相比,性能分别提高了0.91和0.52 dB,有效提升了语音分离的性能及鲁棒性。  相似文献   

5.
针对实际交通场景下的车辆图像分割方法存在模糊、效果差的问题,本文以UNet神经网络模型为基础,提出了一种融合多尺度模块和空间注意力机制的MSSA-UNet模型。在编解码阶段,采用空洞卷积构建多尺度模块,改善卷积层感受野大小受限的同时输出包含多尺度的特征信息。在上采样前,引入空间注意力机制来弥补采样过程中的局部信息丢失问题,提高特征还原能力。结合交叉熵损失与Dice损失,优化网络学习和训练过程,提高模型的分割精度。实验结果表明,本文提出的MSSA-UNet模型对于车辆图像分割任务在IoU评价指标达到83.48%,较改进前准确度提升了2.28%,模型预测值和真实值更接近,分割效果更好,有效提升了模型的分割性能。  相似文献   

6.
现有基于深度学习的目标检测方法在面对空中消费级无人机时,存在鲁棒性差、准确率不足等问题。 对此,提出一种基 于特征增强的 YOLOv4 目标检测方法—FEM-YOLOv4。 首先,针对无人机低、小、慢等特点,改进骨干网络,降低下采样倍数,充 分利用包含细粒度信息的浅层特征;其次,加入特征增强模块(feature enhancement module),通过使用不同空洞率的多分支卷积 层结构,综合不同深度的语义信息和空间信息,增强小尺度无人机的细节语义特征;另外,利用多尺度融合的特征金字塔结构, 突出特征图包含的细节信息和语义信息,提升模型对无人机目标的预测能力;最后,采用 K-means++算法对无人机目标候选框 的尺寸进行聚类分析。 与 6 种目标检算法进行对比,实验结果表明,FEM-YOLOv4 算法的 mAP 和 Recall 分别达到 89. 48%、 97. 4%,优于其他算法,且平均检测速度为 0. 042 s。  相似文献   

7.
针对当前音频场景识别中训练数据量不足的问题,设计了基于知识迁移的非对称卷积声音场景识别系统。相较于现有方法利用音频场景识别数据集从头训练网络模型,该系统在其他任务训练好的网络模型上进行调整和训练,从而保留了源领域的有效信息。与此同时,该系统针对声学特征的特点,采用了非对称卷积模块来增强网络的特征提取能力。实验结果为该系统的准确率相较基准系统提高了0.023,并且该系统的卷积核可视化结果观察到的特征纹理更清晰。结果表明知识迁移可以提升模型的特征表示能力,与非对称卷积结合能进一步提升系统性能。  相似文献   

8.
针对细粒度图像识别存在类间差异小、难以区分等问题,本文通过提升网络对图像细节特征的表达能力,来改善这一问题。为此,设计了一种基于改进的Transformer细粒度识别算法。首先,可变形卷积令牌嵌入通过自适应调整采样点的位置,来改变卷积操作范围及其卷积核的形状,从而增强网络模型对空间信息的感知能力,以获取更为精准的空间信息;其次,高效相关通道注意力机制通过对通道的自动选择,将通道注意力的计算从通道相邻转换成语义相似,来捕获语义相似的通道信息。而精准的空间信息和语义相似的通道信息将有效提升网络模型局部特征感知能力。实验结果表明,与基线算法相比,本文方法在CUB-200-2011、Stanford Cars和Stanford Dogs三个数据集上的识别结果分别提升了1.5%、2.4%、1.5%。结果表明,本文提出的方法通过提升细粒度图像细节特征的表达能力,从而有效提高了细粒度图像识别的有效性。  相似文献   

9.
提出一种改进完全局部二值模式和幂指数加权融合方法的语音情感识别方法。首先,将原始语音样本转化为语谱图,再使用5尺度、8方向的Log-Gabor滤波器对语谱图做处理,放大语谱图的细节信息;然后提取语谱图均匀完全局部二值模式符号特征和改进完全局部二值模式幅值特征的分块直方图特征,之后串联两种特征作为新的融合特征改进完全局部二值模式符号幅值特征。最后,基于支持向量机对3种特征进行决策级幂指数加权融合完成语音情感识别。实验表明,改进完全局部二值模式幅值特征和融合特征可以在降低直方图特征维度的同时提高系统的识别性能;幂指数加权融合方法,扩大分类器间的差距,并使分类性能较好的分类器获得较大的权重,最终有效的提升了语音情感识别系统的性能。与其他算法相对比,验证了算法的有效性。  相似文献   

10.
针对输电线路巡检中可能存在拍摄图像质量不高的问题,以及线路缺陷目标小而分布密集而导致传统方法检测精度不高的问题,提出一种基于超分辨率重建与多尺度特征融合的输电线路缺陷检测方法。首先,使用超分辨率网络对巡检图像进行重建,提升清晰度,丰富图像中包含的特征信息;然后使用改进的YOLOX网络检测巡检图像中的缺陷,在主干网络中嵌入卷积块注意力机制,强化模型对重叠小目标的定位能力;为进一步提升小目标的检测能力,在YOLOX的特征融合网络中新增浅层检测尺度进行特征融合;最后,通过使用CIOU优化边界框损失函数提升模型收敛能力,降低缺陷目标的漏检率。实验结果表明,所提方法能在提升巡检图像质量的基础上对输电线路缺陷准确地检测,精度达到93.27%,相比SSD等经典模型,对小而密集的缺陷目标有着更强的提取能力和鲁棒性。  相似文献   

11.
为提高目前基于掩蔽与基于频谱映射的语音增强方法性能上界以及复杂环境下的泛化能力,提出了一种在联合复频谱 与复掩蔽学习框架下的协作式单通道语音增强方法。 该方法采用编码器-双分支解码器结构,在编解码部分设计了一种交互协 作学习单元(ICU)来监督交互语音信息流,并提供有效的潜在特征空间;中间层则是设计出一种多尺度融合 Transformer,以少 量参数在空间-通道维度上多尺度地提取细节信息后融合输出,同时对语音子频带与全频带信息建模。 在大、小数据集与 115 种噪声环境下进行实验,结果表明该方法仅以 0. 57 M 的参数量,取得比大部分先进且相关方法更优的主、客观指标,具有良好 的鲁棒性与有效性。  相似文献   

12.
为了提高传统SSD算法对小目标检测的准确率,提出一种改进的SSD目标检测算法:采用基于可变形卷积的ResNet50作为SSD算法的特征提取网络,提高对目标的处理能力;设计特征金字塔(FPN)来融合不同层的特征图,丰富浅层特征图的语义信息;在特征融合时引入通道注意机制,提取相应的通道权重,增加重要信息的比例,提高检测效果。最后采用PASCAL-VOC2007开源数据集进行仿真实验,并与传统SSD目标检测算法进行对比,准确率得到显著提高,验证了该算法对小目标检测的有效性。  相似文献   

13.
针对眼底血管图像存在血管细小、视网膜病变而导致分割精度低的问题,提出了一种引入残差块、级联空洞卷积、嵌入注意力机制的U-Net视网膜血管图像分割模型.首先采用提高视网膜图像分辨率,以点噪声为中心、512为边长裁剪来扩增数据集,然后在U-Net模型中引入残差块,增加像素特征的利用率和避免深层网络的退化;并将U-Net网络的底部替换为级联空洞卷积模块,扩大特征图的感受野,提取更丰富的像素特征;最后在解码器中嵌入注意力机制,加重目标特征的权重,减缓无用信息的干扰.基于CHASE数据集的实验结果表明,所提模型的准确率达到了98.2%,灵敏度达到了81.72%,特异值达到了98.90%,与其他多尺度神经网络方法相比体现了更好的分割效果,充分验证了提出改进的U-Net网络模型能有效提高血管分割精度、辅助确诊血管病变.  相似文献   

14.
针对现有壁画修复算法因缺乏对于图像远距离特征的捕获能力而导致修复结果结构紊乱,以及缺失边缘颜色不一致 问题,提出一种多尺度信息融合的生成对抗网络壁画修复算法。首先,将多分支扩张卷积架构引入生成网络,各个子扩张卷 积的卷积核以不同扩张率局部扩大感受野,提取图像的局部特征;其次结合快速傅里叶卷积基于全局感受野提取特征,实现 壁画图像局部到全局的特征提取;最后引入自注意力与PatchGAN 鉴别器以解决缺失边缘颜色不一致问题。根据自制壁画 数据集进行模型的训练和测试,并与多组修复算法进行修复对比,实验结果表明,相较于对比算法,所提算法在峰值信噪比 (PSNR) 平均提升4.42 dB, 结构相似性(SSIM) 平均提升4.4%,学习感知图像块相似度(LPIPS) 平均提升11.3%。实验证明 所提算法能够有效修复破损壁画,修复后的壁画有较好的结构和纹理信息,为真实壁画的修复工作提供了支撑。  相似文献   

15.
为了提高 CenterNet 无锚框目标检测网络的目标检测能力,提出一种基于注意力特征融合和多尺度特征提取网络的改 进 CenterNet 目标检测网络。 首先,为了提升网络对多尺度目标的表达能力,设计了自适应多尺度特征提取网络,利用空洞卷积 对特征图进行重采样获取多尺度特征信息,并在空间维度上进行融合;其次,为了更好地融合语义和尺度不一致的特征,提出了 一种基于通道局部注意力的特征融合模块,自适应地学习浅层特征和深层特征之间的融合权重,保留不同感受域的关键特征信 息。 最后,通过在 VOC 2007 测试集上对本文算法进行验证,实验结果表明,最终算法的检测精度达到 80. 94%,相较于基线算法 CenterNet 提升了 3. 82%,有效提升了无锚框目标检测算法的最终性能  相似文献   

16.
背景噪声是通信系统噪声干扰的来源之一,语音增强可以降低乃至消除噪声干扰,进而提高语音的可懂度.为了减小复杂噪声环境下谱减法引发的音乐噪声,采取正交的多窗谱估计对语音功率谱平滑处理,有效的减小了信息丢失和估计波动.利用自适应谱减系数调整谱增益和谱下限来控制残留噪声,利用优化的IMCRA算法对噪声及时更新来判决语音段和静音段,同时借助特性良好的BP神经网络方法进行训练,语音和噪声谱通过谱减后,波形重构获取增强的语音信号.仿真结果表明语音降噪效果好、可懂度高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号