共查询到19条相似文献,搜索用时 93 毫秒
1.
语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能量差异特征和基音比例特征相结合的语音检测方法,该方法的优点是,在利用长时谱能量差异特征基础上引入基音比例特征,从而有效减少了将信号中突发噪声误判为语音的错误。实验显示,该算法能够在多种信噪比环境下取得很好的检测结果。 相似文献
2.
3.
一种高精度改进型SHR基音检测算法 总被引:2,自引:0,他引:2
利用正弦语音模型中浊音存在的谐波与子谐波,在SHR(subharninctoharmonicratio)算法的基础上,提出了一种改进型高精度基音检测算法ISHR(improvingsubharninctoharmonicratio)。根据幅度调制和频率调制在语音分析中的特性、频域中幅度值和自相关频率比值,该方法采用基于正弦模型的均方误差对语音进行检测,提取出准确基音。仿真结果表明此种算法在基音提取中具有高精度及高可靠性。 相似文献
4.
本文提出了一种基于线性预测残差倒谱的多语音基音频率检测算法,该算法首先对混合语音信号进行线性预测分析,进而计算预测信号与原混合信号的残差,并对残差信号做倒谱变换,得到混合语音信号的线性预测残差倒谱;然后在该信号的残差倒谱中,结合图像处理的技术,利用语音信号基音倒频匹配法检测出多语音信号的基音频率;最后在基音标定的过程中,本文算法利用语音信号的连续特性,依据信号基音频率前后差距变化最小原则标记出各基音所属话者。实验结果表明,本文提出的算法在弱回声及无回声的情况下能快速有效地从单声道混合语音信号中检测出多语音基音信息。 相似文献
5.
6.
基音检测是河南方言语音信号处理中的一个重要环节,针对低信噪比环境下的河南方言语音基音检测准确率低的问题,提出了一种语音信号增强和基音检测相结合的算法.通过多窗谱估计的改进谱减法对语音信号进行降噪处理,对增强后的语音信号用中心削波法消除偏离基音轨迹的野点,再通过自相关法实现基音检测.仿真结果表明,对于低信噪比环境下河南方言语音信号的基音估值检测结果准确,估算出的基音频率和实际基音频率能很好的重合. 相似文献
7.
8.
为了提高说话人识别系统的性能,提出基于改进语谱图的深度学习说话人识别算法。语谱图当中包含了语音的内容、情绪、语种以及说话人身份等多种信息,在以往的说话人识别算法中,往往没有考虑到说话人身份特性,采用直接提取语音中的语谱图作为网络输入,而说话人识别系统中需要提取语谱图中表征身份的信息,因此需要在原始语谱图的基础上进行改进。在语谱图中,基音频率以及共振峰等信息最能表现说话人的身份特征,从而提出根据语音信号中每一帧的基音频率进行自适应梳状滤波,得到改进后的语谱图,再通过卷积神经网络提取说话人特征,从而达到提升识别准确率的效果。网络模型采用MobileNetv2神经网络,该网络模型具有模型参数少、收敛速度快、识别速度快等优点,有利于实际应用。在对照实验结果中,该方法相对于原始语谱图的准确率分别提高了2.3%、5.2%、3%。 相似文献
9.
汉语语音正弦模型特征分析和听觉辨识 总被引:1,自引:0,他引:1
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主... 相似文献
10.
11.
12.
语音端点检测是语音信号预处理过程中的一个重要环节,而在实际的噪声环境下,一些传统的端点检测方法已经不适用,为了提高在强背景噪声条件下语音端点检测的性能,提出了一种在DCT变换域下,基于Gaussian-Gamma模型的语音端点检测算法,设定其纯净语音信号的统计分布函数为Gamma分布,其相应参数使用了最大似然估计以及预测估计的方法.该算法具有较高的准确性和稳健性.仿真实验表明,该方法鲁棒性较好,在较低的信噪比下仍能比较准确的检测到语音信号的端点. 相似文献
13.
端点检测是语音信号处理中的一个非常重要的步骤,其准确度直接影响语音信号处理的速度和效果。传统的端点检测方法可以在高信噪比环境下准确地检测语音端点,但在低信噪比情况下,传统的端点检测特征参数不能充分描述语音信号的特征,导致端点检测效果的下降。为此,本文提出了一种对语音进行改进的多窗谱减法降噪和中值滤波减少低信噪比环境下无话段的起伏后,在结合对数能量、过零率和自相关函数主副峰比值的端点检测方法,实验表明,该方法比传统的端点检测方法具有更好的精度和鲁棒性,在低信噪比环境下取得了良好的端点检测效果。 相似文献
14.
一种应用于语音识别的端点检测改进方法 总被引:1,自引:1,他引:0
语音端点检测是语音识别过程中的重要的一个环节,为了提高在强背景噪声条件下语音端点检测的性能,提出了一种将维纳滤波和改进的多子带熵相结合的方法.不仅有效地减少了背景噪声,而且大大提高了语音端点检测的准确性和稳健性.仿真实验表明,该方法计算简单,可靠信高,在较低的信噪比下仍能比较准确的检测到语音信号的端点. 相似文献
15.
16.
一种改进的信号灵活分割算法及语音信号清-浊音的自动分割 总被引:1,自引:0,他引:1
文中主要对王永忠等提出的灵活分割算法存在的问题做了相应的改进,并做了比较分析,然后将改进后的分割算法应用于语音信号的清-浊音自动分割中.经过大量的理论模型与实际语音信号验证该改进后的算法确实解决了二进分割算法及王永忠方法存在的问题,达到了对信号自适应有效分割.仍然采用Wesfreid等提出的清-浊音识别准则,将新的分割方法应用到实际语音信号的清-浊音自动分割中,不仅同样产生较好划分结果,而且在时间上没有过多的冗余分割. 相似文献
17.
18.
19.
基于局部余弦变换的低比特变速率语音编码算法研究 总被引:1,自引:0,他引:1
提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。 相似文献