首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
由于传统的语音端点检测方法仅以信号的短时能量、过零率等简单的单一特征作为判决特征参数,这些方法在实际应用中,很多都无法满足系统的需要。针对机载环境下的带噪语音进行研究,在传统方法的基础上作了两点改进:把短时能量和过零率结合为一个特征即短时能零积,并把其和短时自相关函数结合起来作为端点检测的特征参数。对于短时自相关的门限,不是利用传统的主副峰比值,而是利用达到副峰的时间间隔作为判决门限。通过对不同信噪比的机载环境下的带噪语音进行试验仿真,发现这种方法比单一的特征参数更有优越性,效果更明显。  相似文献   

2.
王彪 《电子设计工程》2011,19(21):59-61
为了提高语音信号的识别率,提出了一种改进的语音信号特征提取算法。该算法在MFCC参数的基础上,增加每帧信号的短时能量和短时过零率,使得新参数能够更为准确地表征语音信号。通过仿真实验。说明了新特征参数取得了较高的识别率。  相似文献   

3.
高脉冲噪声坏境中双门限法语音端点检测研究   总被引:1,自引:0,他引:1  
刘超  庄圣贤 《电子科技》2013,26(4):116-118,123
语音端点检测是对有效语音段的识别关键技术,准确的端点检测使语音信号的后续处理计算量减少,有效地节约资源。现在多数语音端点检测技术例如能频值、谱熵、小波能量熵变换等都能准确检测出有效的语音段。文中介绍了一种双门限端点检测法,即利用短时平均过零率和短时平均能量法进行双门限检测,再设置一个最短时间门限,有效地在高脉冲噪声环境中准确识别汉语发音。通过与其他方法对比实验,文中双门限技术在短时高脉冲噪声环境下能有效提高语音识别率。仿真结果表明,端点检测正确率达93%。  相似文献   

4.
语音情感识别中,情感特征信息的提取和选择、情感识别模型的选择是2个重要部分.结合语音信号的声学特征参数和听觉特征参数进行情感识别,针对两类不同情感之间的差别选择最优的特征集,并设计了一个基于神经网络的情感交叉识别,与听觉特征参数结合,经过分类器得到识别情感,达到平均92%识别率.  相似文献   

5.
王兴斌  徐望  王炳锡  马治飞 《信号处理》2005,21(Z1):204-207
语音识别中,语音信号能量是一个重要的识别特征参数.在噪声环境下,语音信号能量产生的畸变是导致识别率下降的原因之一.本文依据RASTA-PLP分析的增益参数和最小均方误差估计准则,给出了带噪语音能量和干净语音信号能量的线性映射关系.在中文连续语音识别中的应用表明,利用该映射关系得到的干净语音能量估计,可使信噪比为5dB的白噪声环境下的识别正确率提高21.36%.  相似文献   

6.
一种基于短时平均幅度差的语音检测算法   总被引:1,自引:0,他引:1  
提出了一种利用语音信号的短时平均幅度差特征并结合短时平均幅度的语音检测算法。该算法在专用通信系统中,用以对接收到的电台信号进行分析,判断其中是否有语音信号,从而控制半双工电台的发射开关,使其处于接收或发射状态。实验表明,该算法能在较低的信噪比情况下准确地检测出语音信号,而且计算方法简单,硬件处理容易,可靠性高,能够满足实时系统的需要。  相似文献   

7.
利用模糊熵进行参数有效性分析的语音情感识别   总被引:4,自引:0,他引:4  
本文利用模糊熵理论来分析语音信号情感特征参数相对于识别情感模式的不确定度,并提出了一种利用模糊熵对情感参数有效性进行度量的方法。并将参数有效性分析结合模糊综合判别对情感语音信号作情感识别,取得了较好效果。  相似文献   

8.
《无线电工程》2019,(10):899-904
针对移动语音通信对语音区分性和内容保持操作鲁棒性,以及实时认证的要求,提出了一种基于短时自相关的语音感知哈希认证算法。该算法对语音进行预处理、分帧和加窗,进行短时自相关分析,并结合非负矩阵分解得到特征参数矩阵,利用特征参数矩阵生成感知哈希序列进行语音内容认证。实验结果表明,该算法具有较好的区分性和鲁棒性,能够满足语音通信实时认证的要求。  相似文献   

9.
基于自相关最大值和过门限率的语音端点检测   总被引:1,自引:0,他引:1  
席大林  李如玮  陈海龙 《电声技术》2010,34(4):53-57,66
语音处理中,在噪声环境尤其是在非平稳噪音环境下进行端点检测是很困难的。在低信噪比的情况下,传统用于端点检测的特征参数不能充分描述语音信号的特征,导致端点检测的效果严重退化。为此,笔者从语音信号的时域或频域出发,提出了一种把短时自相关函数最大值和短时过门限率相结合的方法。实验表明,该方法弥补了自相关函数最大值方法和过零率的不足,提高了语音端点检测的性能。  相似文献   

10.
呼德  陈喆  殷福亮 《信号处理》2017,33(3):437-443
在电视会议系统中,为获得接近真实的会议交流氛围,混音技术不可或缺。本文利用语音信号的响度特性,提出一种自动等响度数字混音算法。该算法首先利用信号平均功率和短时自相关函数进行语音活动检测(VAD),判断参与混音的每路信号中是否含有语音信号。然后,利用时变滤波器进行滤波处理,抑制混音过程中引入的噪声。最后,利用语音信号响度计算各路信号的权重,使各路语音的平均响度保持一致。仿真实验结果表明,本文的混音算法可使各路信号的平均响度基本相同,并具有良好的语音质量。   相似文献   

11.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

12.
语音的基频(也称音高、基音周期或F0)及其变化规律是语音信号的一个重要特征,在语音情绪识别、声纹识别中有重要的应用。而语音基频的提取一直是语音信号处理中的难点,这也是语音基频特征未能广泛应用于语音识别等应用的重要原因,因此准确高效的提取音高在语音信号处理中能够有重要的意义。本文基于归一化自相关函数,结合倒频谱方法,提取了一种改进的基于归一化自相关的语音基频提取算法,实验证明该方法在基频提取中取得了较好的结果。  相似文献   

13.
针对在低信噪比环境下语音识别率较低的问题,提出了一种基于FastIca和MMSE-LSA相结合的算法。首先,用FastIca对低信噪比语音进行语音提取,再使用MMSE-LSA方法处理得到信噪比改善的语音信号。用0~9十个数字做孤立词语音识别。仿真实验证明,用本算法增强后的语音识别率达到80%以上,可以有效地提高低信噪比环境下语音识别率。  相似文献   

14.
Accurate endpoint detection is a necessary capability for speech recognition.A new energy measure method based on the empirical mode decomposition(EMD)algorithm and Tcager energy operator(TEO)is proposed to locate endpoint intervals of a speech signal embedded in noise.With the EMD,the noise signals can be decomposed into different numbers of sub-signals called intrinsic mode functions(IMFs),which is a zero-mean AM-FM component.Then TEO can be used to extract the desired feature of the modulation energy for IMF components.In order to show the effectiveness of the proposed method,examples are presented to show that the new measure is more effective than traditional measures.The present experimental results show that the measure can be used to improve the performance of endpoint detection algorithms and the accuracy of this algorithm is quite satisfactory and acceptable.  相似文献   

15.
语音信号去混响原理与技术   总被引:1,自引:0,他引:1  
语音信号去混响技术在通信、语言识别等方面有重要应用。介绍了国内外相关研究动态和方法,阐述了声音混响过程和倒谱法去混响原理,简要介绍了传声器阵列-倒谱法去混响技术。  相似文献   

16.
分布式语音识别的前端处理及相关标准   总被引:1,自引:1,他引:0  
语音识别在实际应用中受到信道噪声和便携终端计算、存储能力不足等因素制约。分布式语音识别(DSR)不仅解决了上述的问题,还有占用带宽窄、综合成本低等优点,但其应用的前提是提取的参数必须标准化。文中介绍了分布式语音识别前端处理的基本结构以及相关标准。  相似文献   

17.
王彪 《电子设计工程》2012,20(6):29-30,33
为了提高语音信号的识别率。提出了一种改进的LPCC参数提取方法。该方法先对语音信号进行预加重、分帧加窗处理。然后进行小波分解,在此基础上提取LPCC参数,从而构成新向量作为每帧信号的特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

18.
基于双门限两级判决的语音端点检测方法   总被引:1,自引:0,他引:1  
路青起  白燕燕 《电子科技》2012,25(1):13-15,19
端点检测是语音信号处理过程中的重要步骤,其准确性直接影响语音信号处理的速度和结果。因此对于端点检测方法,特别是在噪声环境下的端点检测研究,一直是语音信号处理中的热点。文中针对声纹识别系统所作的端点检测前端处理,对比了利用短时能量和短时平均过零率进行端点检测的方法,运用Matlab实现了双门限法端点检测的编程和仿真。仿真结果表明,端点检测准确时识别率为93%。  相似文献   

19.
加性噪声条件下鲁棒说话人确认   总被引:1,自引:0,他引:1       下载免费PDF全文
张二华  王明合  唐振民 《电子学报》2019,47(6):1244-1250
基于非负矩阵分解的语音去噪,在提高语音信号信噪比的同时,也会引起语音失真,从而导致噪声环境下说话人确认系统性能下降.本文提出基于分区约束非负矩阵分解的语音去噪方法(Nonnegative Matrix Factorization with Partial Constrains,PCNMF),目的是在未知和非平稳噪声条件下提高话人确认系统的鲁棒性.PCNMF在满足分区约束条件的基础上分别构建语音字典和噪声字典.考虑到传统语音训练产生的语音字典往往含有一定的噪声成分,PCNMF通过数学模型产生基音及泛音频谱,在此基础上利用该频谱模仿人声的共振峰结构来合成字典,从而保证语音字典纯净性.另一方面,为了克服传统噪声字典构建方法带来的部分噪声信息丢失问题,PCNMF对在线分离出的噪声样本进行分帧和短时傅里叶变换,然后以帧为单位线性组合生成噪声字典.性能评估实验引入了多种噪声类型,实验结果表明PCNMF可有效提高说话人确认系统的鲁棒性,特别是在未知和非平稳噪声条件下其等错率相比基线系统(Multi-Condition)平均降低了5.2%.  相似文献   

20.
在语音加密通信过程中,接收方需要通过信号同步来实现精确的解密并恢复出语音信号,而现有方法精确度低且运算量大。为了解决端到端语音加密、解密过程中的同步问题,设计了一种新的基于线性调频信号的同步信号结构。该同步信号是基于带宽经过筛选的线性调频信号产生,避免了因为添加同步信号而使带宽扩展的问题。同步信号结构由两种不同长度的线性调频信号组合而成,不同的组合形式又会产生不同的同步效果。这种结构设计大大提高了同步的精确度和减少了同步运算量。理论和实验证明:该方法可以实现对接收信号帧起始位置进行精确地定位;不会展宽和影响语音信号的频谱;可以透过语音编解码器传输;具有一定的抗噪声性能;运算量比原始结构的同步信号大大减少。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号