首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
提出一种与主观评价相关性较高的可懂度客观评价算法。传统的基于频域分段信噪比的可懂度评价算法与主观评价的相关性不高,原因在于没有分别计算谱衰减畸变和谱放大畸变这两种畸变。为了克服这一缺点,提出将增强语音分解为衰减畸变、放大倍数小于6.02 dB的放大畸变、放大倍数大于6.02 dB的放大畸变三部分,分别计算其频域信噪比,用多线性回归方法综合这三种畸变值,使其与主观可懂值的相关值达到最高。实验结果表明,用这种方法对句子的可懂度评价结果与主观评价的相关值达到0.91。  相似文献   

2.
语音可懂度是语音信号的一种重要属性,在归一化协方差评价方法(NCM)的基础之上,以相对均方根(RMS)为阈值对语音信号进行分割,对高于均方值的语音段和低于均方值的语音段进行了分段可懂度评估,同时,提出了一种新的可懂度评价模型,结合了这两种语音段对语音可懂度的相对贡献,共同评价语音的可懂度。实验结果表明,高均方语音段相对于低均方语音段对可懂度具有更高的贡献,利用新的模型将这两种语音段的评价结果进行重新结合,评价效果得到了显著提升。  相似文献   

3.
董胡  蒋伟进 《测控技术》2016,35(11):1-4
分析遗传算法和仿生小波变换的原理和方法,提出一种基于遗传算法的仿生小波语音增强算法.首先将普通小波变换转换为仿生小波变换,得到仿生小波变换系数,接着利用遗传算法的选择、交叉、变异获得仿生小波的优化阈值参数,从而确定最优小波阈值,随后结合最优小波阈值和改进阈值函数去噪,最终将经阈值处理后的仿生小波的系数变换至普通小波域且实行连续小波逆变换,获得增强的语音信号.仿真结果表明,在低信噪比环境下,与传统的最小统计和仿生小波变换算法相比较,经本文提出的算法处理后的增强语音其失真和残余噪声更小,语音质量和可懂度都较高.  相似文献   

4.
传统的语音评价算法,如SNR,存在语音的可懂度相关性不高的问题.有研究表明,语音的不同部分对可懂度的贡献不同,语音的浊音起始段对可懂度的影响较大.提出一种可懂度相关性相对较高的语音评价算法.在计算分段SNR之前,对语音段进行选择,选出起始段.所提出方法的可懂度计算结果与主观得分进行比较,实验结果表明,结合语音起始段(speech onset)检测算法,能够将可懂度与主观评价的相关值分别提高0.11(辅音)和0.06(句子),这也从一个侧面验证了语音的起始段对可懂度有较大影响这一研究结论.  相似文献   

5.
对于开放型办公室语音掩蔽系统性能的评价,语言可懂度是很重要的一个方面,目前通常采取的客观评价方法是STI。将语音信号按一定时间帧长反转后得到的信号我们称为时间反转语音,时间反转语音已被作为有效掩蔽信号之一。虽然对于由平稳噪声掩蔽的语音信号,STI与主观理解的语言可懂度相关性很好。但研究发现STI不适用于估计由时间反转语音掩蔽的语音信号的语言可懂度。文章分析了STI、PESQ及mNCM客观评价方法并进行了实验,实验结果表明,PESQ及mNCM对于由反转语音掩蔽的语音信号仍能较好估计语言可懂度。文章根据客观评价结果,进一步比较了反转语音掩蔽算法的不同参数(反转帧长与信噪比)对于语言可懂度的影响。发现反转帧长的增加和信噪比的降低会导致较低的语言可懂度。  相似文献   

6.
在水下安保系统中,使用水下喊话器对可疑蛙人进行警告.因为语音信号含有丰富的频率,而水声换能器的带宽有限,本文基于水声换能器的带通特性,提出了一种评价带通滤波后语音可懂度的客观方法,这种方法用一个指数来评价语音的可懂度.本文分析了这种方法的原理,同时使用典型语音进行了实验,并与主观可懂度指数进行了比较,取得了很好的效果.  相似文献   

7.
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。  相似文献   

8.
具有高可懂度的改进的维纳滤波的语音增强算法   总被引:1,自引:0,他引:1  
提出一种具有较高可懂度的基于维纳滤波的语音增强算法。相比于其他语音增强算法,维纳滤波法可以明显提高语音质量且含有较少的音乐噪声,但是它和其他现有语音增强算法一样,都无法有效提高语音可懂度。因为维纳滤波法和其他现有算法都过多注重噪声减少,却忽略了SNR(信噪比)的估计误差和不同的语音幅度谱畸变对可懂度有更重要的影响。为改进这些缺点,此研究依据于先验SNR和增益函数来判定SNR估计误差和语音畸变区域,然后对先验SNR小于-10 d B区域的增益函数进行修正,以及幅度谱畸变大于6.02 d B区域语音进行限制。实验证明,该算法能有效提升增强后语音可懂度NCM(归一化协方差方法)的评测值。  相似文献   

9.
基于自适应仿生小波变换的语音增强方法   总被引:1,自引:0,他引:1  
分析自适应滤波和小波滤波的原理与方法,提出一种基于自适应仿生小波变换的语音增强方法.该方法首先用仿生小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,然后将经仿生小波变换所分离出来的噪声成分作为自适应滤波器的输入.通过选用自适应滤波器的最小二乘算法(RLS)从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声.实验结果表明,该方法对语音信号有显著的增强效果,能实现语音信号在同频段对噪声成分和有用信号的最佳估计.  相似文献   

10.
基于改进谱减法的语音增强研究   总被引:2,自引:0,他引:2  
语音增强技术是语音信号处理中的重要课题之一,谱减法是目前语音增强处理中常用的方法.针对传统谱减法残余音乐噪声过强,清音部分损失严莺的缺点,引入了一种利用语音信号的短时平均幅度差特征并结合短时平均幅度的语音检测算法,对传统的谱减法进行了改进.根据采集的真实航空噪声数据,将传统谱减法和改进的谱减法结果进行了比较分析.仿真结果表明,改进形式的谱减法可以有效降低音乐噪声,提高信噪比和町懂度,可以满足语音增强的要求.  相似文献   

11.
当前主流的图片彩色化方法包括传统算法和深度学习方法.随着深度学习模型的发展,基于深度学习的灰度图像彩色化方法能带来更好的着色效果,但仍然存在细节损失和着色枯燥问题.针对上述问题,本文将CycleGAN模型应用在非单一类别的灰度图像彩色化上,使其在动物、植物、风景等图片上有逼真的着色效果.模型结构上对CycleGAN模型的激活函数加以改进,在生成器使用PReLU激活函数,使模型更易于训练.在判别器使用PatchGAN提高图片高分辨率上的颜色细节.通过ImageNet数据集5个热门类别图像的训练后,模型对动植物与风景图彩色化的效果十分逼真.在图像评估指标中,该模型在PSNR中比GAN高了0.603 dB约有2.1%的提升,在SSIM中明显高于其他模型,在效果上有5.1%的提升.从视觉感受来看,通过CycleGAN彩色化的图片饱和度更高,在视觉真实性上高于VGG和GAN等模型,解决了着色枯燥问题,而且更容易还原图片中的颜色细节,避免细节损失.  相似文献   

12.
针对语音去噪问题,提出一种基于循环生成对抗网络(CycleGAN)的方法来对声音场景中的语音进行去噪.该方法把CycleGAN的网络模型与不同领域间的语音转换技术进行结合与优化,通过提取语音频谱包络特征,对语音进行编码与解码的处理,旨在用先进的生成技术实现语音端到端的去噪,从而简化语音去噪过程中带来的高阶差异问题,同时...  相似文献   

13.
杨玺  樊晓平 《控制与决策》2006,21(9):1033-1036
提出一种基于仿生小波变换以及自适应阈值的语音增强方法.含噪语音通过仿生小波变换后,针对不同的尺度采用不同的阈值函数进行去噪.由于在小波变换过程中考虑了人耳的听觉特性,所提出方法优于基本的小波语音增强方法.实验表明,该方法在多种噪声条件下均具有较好的语音增强效果.  相似文献   

14.
自行火炮路面振动信号时频特性研究   总被引:1,自引:0,他引:1  
自行火炮越野行驶减速停车过程车体的振动是非平稳的,传统的信号处理方法难以得出更多有用信息。利用连续小波变换在时域和频域具有的良好局部化特性,结合传统信号分析手段,对某型自行火炮减速停车过程的振动加速度信号进行了时频分析,研究了自行火炮的非平稳振动特性。结果表明:车体振动加速度的幅值和频率均随车速的提高而增大,采样信号小波系数灰度图给出了火炮振动特征随时间和频率的变化规律,克服了传统分析方法的不足。另外,实施了连续小波变换尺度的非等间隔选取,在不影响低频分析准确性的同时,处理结果对分析信号高频成分非常有效。  相似文献   

15.
提出了一种用开关电流技术实现连续小波变换的改进方法,即采用梯形公式逼近数值积分的原理改进用于逼近连续小波变换的带通滤波器组,并用开关电流电路实现,还详细分析了这种改进对于减小逼近误差的优势所在.以开关电流的双二次滤波器实现八通道的Marr小波为例,简述了设计过程和仿真结果,从而证实了这种改进的可行性.  相似文献   

16.
针对水下观测图像的颜色失真和散射模糊问题, 提出一种基于改进循环一致性生成对抗网络(Cycle-consistent generative adversarial networks, CycleGAN)的水下图像颜色校正与增强算法. 为了利用CycleGAN学习水下降质图像到空气中图像的映射关系, 对传统CycleGAN的损失函数进行了改进, 提出了基于图像强边缘结构相似度(Strong edge and structure similarity, SESS)损失函数的SESS-CycleGAN, SESS-CycleGAN可以在保留原水下图像的边缘结构信息的前提下实现水下降质图像的颜色校正和对比度增强. 为了确保增强后图像和真实脱水图像颜色的一致性, 建立了SESS-CycleGAN和正向生成网络G相结合的网络结构; 并提出了两阶段学习策略, 即先利用非成对训练集以弱监督方式进行SESS-CycleGAN学习, 然后再利用少量成对训练集以强监督方式进行正向生成网络G的监督式学习. 实验结果表明: 本文算法在校正水下图像颜色失真的同时还增强了图像对比度, 且较好地实现了增强后图像和真实脱水图像视觉颜色的一致性.  相似文献   

17.
针对有监督超分辨率算法训练过程需要大量成对图像、处理真实低分辨率图像视觉恢复效果差等问题,提出了一种基于改进CycleGAN的半监督算法Cycle-SRNet.首先,利用退化模型获得与真实低分辨率人脸相似的图像,用于训练网络参数;其次,通过重建模型恢复出具有真实效果的高分辨率人脸图像;最后引入感知损失函数保持人脸结构相似性,以更好地恢复面部特征.实验结果表明,该算法不需要成对的图像进行网络训练,在视觉效果上能够将模糊的视频监控低分辨率人脸图像恢复成清晰可辨的人脸图像,在FID、PSNR和SSIM指标上超越了SRCNN、SRGAN、CinCGAN等方法.  相似文献   

18.
随着人工智能技术的不断创新发展,语音识别技术一直在迭代升级,而语音去噪是语音识别领域中关键研究点之一.由于这些外界干扰声的存在,就使得原本的语音信号变得不再纯净,或多或少会对所需传输的语音信号有所影响.传统的信号分析以傅立叶变换为基础,但傅立叶分析属于全局变换,变换只能全部在时域变换或在频域变换.因此,傅里叶变换不能获...  相似文献   

19.
小波变换具有数学显微镜特点和频域带通特性,可用于对遥感图像进行分析,为了探索更好的遥感图像尺度分析方法,提出利用二维连续小波变换(墨西哥帽小波)结合地物类型分布图来对NOAA/AVHRR影像的4波段数据进行尺度分析。结果表明,在小尺度下连续小波变换系数可显示不同地物类型、相对差异、位置及形状等信息,可用作细致分析;而在大尺度下该系数则主要表现了由水陆、地貌导致的地域差异,可用于概貌观察。另外,不同时相数据的大尺度分析对比,还体现了空间格局和变化趋势。通常小波变换系数确定的不同地物类型的尺度曲线反映了不同地物的影像信号强度和相互影响,而过零点位置的变化则反映了信号的突变。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号