首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
语音信号包络提取与汉语音节包络头分析   总被引:1,自引:0,他引:1  
复解析子小波变换(CAWT)将希尔伯特变换(HT)与子波变换(WT)紧密地结合在一起,在信号处理方面具有良好的表现。本文将复解析子波变换应用于语音信号的包络提取中,数字仿真结果表明,该方法优于传统的希尔伯特变换法,音节包络头的发现为声韵分割和音节识别提供了一种新的依据。  相似文献   

2.
对时变性强的非平稳汉语语音信号,建议采用变时-频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱,实验结果表明,该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调,区分了清、浊音,并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提供了一种新的思路。  相似文献   

3.
陶亮  庄镇泉 《现代计算机》2000,(101):6-8,16
本文提出了语音信号的快速实值离散Gabor变换(RDGT)方法,讨论了RDGT系数计算语音复谱图值、语谱图生成和语音信号的快速重建问题,并在文末给出了实例。  相似文献   

4.
本文提出了语音信号的快速实值离散Gabor变换(RDGT)方法,讨论了由RDGT系数计算语音复谱图值、语谱图生成和语音信号的快速重建问题,并在文末给出了实例。  相似文献   

5.
基于听觉模型的子波变换语音处理   总被引:2,自引:0,他引:2  
首先讨论了人类听觉信号处理的原理,进而将基于听觉模型的子波变换(WT)与短时傅里叶变换(STFT)进行了比较,突出了WT信号处理的独特之处。然后,简要讨论了其在语音处理中的应用。最后,给出了应用WT来进行声、韵母划分和音素周期检测的实验,其结果显示了WT在语音处理中的良好性能。  相似文献   

6.
针对现有的语音增强方法对语谱图特征关联信息表达有限和去噪效果不理想的问题,提出一种双复数卷积注意聚合递归网络(DCCARN)的语音增强方法。首先,建立双复数卷积网络,对短时傅里叶变换后的语谱图特征进行两分支信息编码;其次,将两分支中编码分别使用特征块间和特征块内注意力机制对不同的语音特征信息进行重标注;再次,使用长短期记忆(LSTM)网络处理长时间序列信息,并用两解码器还原语谱图特征并聚合这些特征;最后,经短时逆傅里叶变换生成目标语音波形,以达到抑制噪声的目的。在公开数据集VBD(Voice Bank+DMAND)和加噪的TIMIT数据集上进行的实验的结果表明,与相位感知的深度复数卷积递归网络(DCCRN)相比,DCCARN在客观语音感知质量指标(PESQ)上分别提升了0.150和0.077~0.087。这验证了所提方法能更准确地捕获语谱图特征的关联信息,更有效地抑制噪声,并提高语音的清晰度。  相似文献   

7.
一种Bark子波变换的电子耳蜗语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种Bark子波变换的电子耳蜗语音增强算法。该算法首先引入与人耳听觉系统更为适应的Bark子波变换来进行电子耳蜗CIS语音信号处理,然后在每个Bark通道中利用非线性谱减法对其进行语音增强,谱减法的参数由人耳隐蔽阈值来控制。结果表明:即使在低信噪比的情况下,信噪比也能提高16 dB左右,合成的语音对于电子耳蜗使用者具有较好的清晰度和可懂度。  相似文献   

8.
在Bark子波的构造的基础上,提出一种改进的Bark子波变换构造方法,即直接由临界带中心频率确定Bark子波的中心频率,保证了其通带和临界带的对应一致性,并与人耳的听觉系统十分吻合。采用Bark子波对带噪语音进行分解,在语音信号的子带层次上用一种类似于软阈值的无穷阶可导的函数进行阈值处理,并应用谱减法进行二次增强。仿真实验表明,构建Bark子波与增强算法使信噪比和PESQ得分都有较大提高,特别是在信噪比较高时,语音具有很好的清晰度和可懂度。  相似文献   

9.
魏莹  王双维  潘迪  张玲  许廷发  梁士利 《计算机科学》2016,43(Z11):215-219, 232
提出一种基于宽窄带语谱图融合分带投影的方法对特定人二字汉语词汇进行识别。该方法将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对窄带语谱图进行等宽度分带行投影和二进宽度分带行投影,并将其分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将窄带语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。然后对宽带语谱图进行等宽度分带列投影,作为第4个特征集合。将上述特征集合作为识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,采用前3个特征集合的特征向量对特定人二字汉语词汇识别的正确识别率可达92.4%,采用第4个特征集合的特征值对特定人二字词汇识别的正确识别率可达80%,而采用上述4个特征集合的特征值融合对特定人二字汉语词汇识别的正确识别率可达95.4%。该特征融合的方法为汉语词汇的识别提供了新的思路。  相似文献   

10.
提出了一种基于Bark子波变换和概率神经网络(PNN)的语音识别模型。利用符合人耳听觉特性的Bark滤波器组进行信号重构并提取语音特征,然后利用训练好的概率神经网络进行识别。通过训练大量语音样本来构成语音识别库,并建立综合识别系统。实验结果表明该方法与传统的LPCC/DTW和MFCC/DWT方法相比,识别率分别提高了14.9%和10.1%,达到了96.9%的识别率。  相似文献   

11.
双树复小波包变换语音增强新算法   总被引:7,自引:0,他引:7  
实小波包变换是语音增强中效果较好的一种算法,利用阈值的方法对小波包系数进行压缩进而重构语音信号.分析了实小波包变换的平移敏感性,以及其对语音进行增强时的缺陷.提出采用双树复小波包变换方法进行语音增强,当低通滤波器和高通滤波器对应的小波基近似为希尔伯特变换对时,该变换能大大减小实小波包变换中的平移敏感性.同时考虑小波包系数之间的相互关系,提出了重叠块复阈值算法.结果表明,算法优于传统实小波包变换及点阈值算法,尤其对含周期噪声的语音信号,双树复小波包变换算法的优势更为明显.  相似文献   

12.
提出一种基于人类听觉特性的自适应小波滤波算法。该方法用听觉感知小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,将经听觉感知小波变换所分离出来的噪声成分作为自适应滤波器的输入。通过采用递推最小二乘算法从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声。结果表明,该方法能实现非平稳信号在同频段对噪声成分和有用信号的最佳估计,提高了语音的清晰度和可懂度。  相似文献   

13.
提出一种单通道语音增强算法。首先由接收到的单声道语音信号的含噪部分构造一个假想噪声源,将这一噪声源和含噪的信号作为多通道自适应去相关(MAD)盲分离算法的输入,得到增强的语音信号。进一步将这一增强的语音作为输入,利用Daubechies小波对其进行分解,在小波域中选取合适的阈值函数进行滤波,然后合成时域语音信号。根据以上步骤得到的增强语音有较高的信噪比及可懂度。  相似文献   

14.
给出了一种新的语音信号的可视化方法,利用基于小波变换的时频分析方法来模拟基底膜带通滤波器的特性,克服了SFT(短时傅里叶变换)分析对高、低频段具有相同的时间分辨率和频率分辨率的缺点。对经过小波变换滤波后的语音信号进行特征编码形成语音的组合特征,将该组合特征作为一个新的特征量来表示语音信息,并将这种特征用简单的图形表示出来。利用聋哑人自身的大脑来识别语音,达到训练其口语的目的。  相似文献   

15.
论文首先分析了小波的时频特性,基于该特性对语音信号进行小波域滤波,提出对听觉感知有效的频率分量,然后用参数滤波方法进行分段。参数滤波的基本思想是以一个变化的参数对信号进行滤波,得到信号在不同频带中的分量。可以证明若滤波参数以一定的规律变化,则这些滤波分量的一阶自相关表示了信号的相关结构。实验表明对上述经小波域滤波后的频率分量进行基于参数滤波的音素分段会得到较准确的分段效果。  相似文献   

16.
基于小波调制尺度的语音特征参数提取方法   总被引:3,自引:0,他引:3  
马昕  杜利民 《计算机应用》2005,25(6):1342-1344
时频分析的理论基础上,提出了一种基于小波调制尺度特征的参数提取方法。根据人对调制谱信息的感知特性及干扰在调制谱中的特点,采用小波分析技术及归一化处理求得归一化的小波调制尺度特征参数,并以此作为语音的动态特征应用于语音识别系统。通过与MFCC一阶、二阶系数对比的汉语音节识别实验表明,该方法在抗噪声干扰和说话速率变化等方面比MFCC的一阶、二阶系数的性能优越,为提高语音识别鲁棒性提供了一种新途径。  相似文献   

17.
董胡  蒋伟进 《测控技术》2016,35(11):1-4
分析遗传算法和仿生小波变换的原理和方法,提出一种基于遗传算法的仿生小波语音增强算法.首先将普通小波变换转换为仿生小波变换,得到仿生小波变换系数,接着利用遗传算法的选择、交叉、变异获得仿生小波的优化阈值参数,从而确定最优小波阈值,随后结合最优小波阈值和改进阈值函数去噪,最终将经阈值处理后的仿生小波的系数变换至普通小波域且实行连续小波逆变换,获得增强的语音信号.仿真结果表明,在低信噪比环境下,与传统的最小统计和仿生小波变换算法相比较,经本文提出的算法处理后的增强语音其失真和残余噪声更小,语音质量和可懂度都较高.  相似文献   

18.
谐波正弦语音模型因固定帧长不能使每个谐波得到最佳分辨率,而分辨率决定着语音的建模效果。因此提出小波多分辨率的谐波正弦语音模型,将谐波语音信号通过小波变换分解成多分辨率子带信号,利用谐波正弦语音模型对这些子带信号独立建模,将建模后的各子带信号相加合成。仿真实验显示该模型的信号重构误差降低约两个数量级,通过PESQ软件测试得到的MOS分值约提高0.3。  相似文献   

19.
提出了一种基于最佳小波包变换和SPIHT编码的语音信号压缩编码方法。该方法首先对语音信号进行小波包变换,求解最佳小波树,进行动态位分配,再用改进的SPIHT算法对变换后的小波系数进行压缩编码。并且采用了熵编码的方法进一步提高了压缩比。实验表明,该方法在较高的压缩比下能获得较好的信号重构质量,计算复杂度低,延迟小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号