首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对传统谱减语音增强算法增强后的语音信号会残留明显的"音乐噪声"的问题,采用多频带谱减算法对其进行改进。改进算法的原理是将带噪的语音信号按照频率划分成不同的频带,并使这些频带之间互不交叠,根据频带内带有噪声的语音信号和噪声信号信噪比,利用自适应算法求得该频带的过减因子。仿真结果表明:改进多频带谱减算法的语音增强效果优于传统谱减法。  相似文献   

2.
许超  曹志刚 《信号处理》2003,19(3):262-265
噪声情况下的语音识别是个挑战性的问题。目前的处理方法普遍需要估计噪声或者信噪比,从而其性能依赖于噪声估计的好坏。本文提出了一种基于语音信号局部能量的可靠性加权方法,该方法着眼于语音本身的结构,避免了对噪声的估计。另外,带噪语音识别的实验结果证明该方法能很好的提高识别系统的抗噪声性能。  相似文献   

3.
基于LPC美尔倒谱特征的带噪语音端点检测   总被引:2,自引:0,他引:2  
复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取IPC美尔倒谱特征分析,根据Mel倒谱距离判决,采用自适应噪声估计,实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。  相似文献   

4.
吴亚琴 《电子世界》2014,(3):119-119
在实际应用中,待分析的语音信号一般是被噪声污染的语音,很大程度上影响了语音处理系统的性能。为此,需要我们对带噪语音进行语音增强处理,抑制噪声,恢复纯净语音。本文就谱减法对带噪语音进行处理,并利用matlab行仿真,验证了谱减法的语音增强的效果。  相似文献   

5.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

6.
基于分数阶谱相减的语音增强法   总被引:2,自引:0,他引:2  
该文提出了基于分数阶谱相减的语音增强法(FSS)。该方法通过对带噪语音信号作分数阶傅里叶变换(FRFT),将得到的分数阶语噪混合谱与估计的分数阶噪声谱相减,最后利用分数阶Fourier反变换获得去噪后的语音信号。理论分析表明,所提方法存在一个最佳分数阶阶数,使得语噪混合信号能在分数阶变换域得到最好的分离,从而有效地提高了增强语音的性能。计算机仿真表明,对于混有加性白噪声的男/女声发音信号,所提方法在信噪比提高量和Itakura距离减少量两个方面都优于传统的谱相减法(SS),并且增强语音中的音乐噪声得到了明显抑制。  相似文献   

7.
一种基于改进的谱减法的语音增强算法   总被引:2,自引:1,他引:1  
为改善语音质量,提高语音识别系统的性能,提出了一种新的基于改进的谱减法的语音增强算法。新算法在所有噪声都能转化为加性高斯白噪声的基础上,依据高斯白噪声幅度谱服从瑞利分布的特点,对噪声幅度谱进行精确的估计,并采用频带方差进行端点检测以及时检出语音。仿真分析表明:该方法能够较好地抑制噪声,噪声消除效果较传统算法具有明显的提高。  相似文献   

8.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

9.
徐娜  吴长奇 《信号处理》2018,34(7):876-881
为了抑制小型语音通信设备中的方向性噪声干扰问题,提出了一种结合差分阵列与幅度谱减的双麦语音增强算法。该算法首先利用一阶差分阵列技术,对两麦克风采集到的带噪语音信号进行处理,得到语音通道信号和噪声通道信号。接着利用差分阵列处理后的两通道信号对语音通道信号的信噪比进行估计。最后利用幅度谱减法对语音通道信号中残留噪声进行消除。针对语音通道信号的信噪比估计,本文给出了两种新奇的计算方法。仿真实验表明,该算法有效的抑制了方向噪声,改善了语音的质量,去噪效果及语音质量均优于对比算法。   相似文献   

10.
并行子带HMM最大后验概率自适应非线性类估计算法   总被引:1,自引:0,他引:1  
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法.  相似文献   

11.
陈显治 《世界电信》1995,8(5):42-45
语音信号处理用以实现人一人、人一机器和机器一人的通信,是现代通信领域的重要环节。本文详细介绍了其三个分支,即语音编码、语音合成、语音识别和理解的研究和应用现状及其发展。  相似文献   

12.
As a promising technique, sparse coding can be widely used for representation, compression, de-noising and separation of signals. This technique has been introduced into noisy speech processing, where enhancing speech itself or speech feature remains a challenge. Unlike other fields where noises are dense, the noises in speech are often sparse or partly sparse over the speech dictionary, re-sulting in performance degradation. It is necessary to un-derstand the noise conditions of speech environments and the applied range of sparse coding. This paper analyzes the assumptions of sparse coding and provides the bounds of reconstruction error for two sparse coding methods which are widely used. Based on this analysis, the performance of the two methods under different conditions are com-pared. The results show that the performance of sparse coding can be improved by a well-prepared noise dictio-nary. Experiments on speech enhancement and recognition are conducted, and the results coincide with the theoretical analysis well.  相似文献   

13.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

14.
Based on the observation that dissimilar speech enhancement algorithms perform differently for different types of interference and noise conditions, we propose a context-adaptive speech pre-processing scheme, which performs adaptive selection of the most advantageous speech enhancement algorithm for each condition. The selection process is based on an unsupervised clustering of the acoustic feature space and a subsequent mapping function that identifies the most appropriate speech enhancement channel for each audio input, corresponding to unknown environmental conditions. Experiments performed on the MoveOn motorcycle speech and noise database validate the practical value of the proposed scheme for speech enhancement and demonstrate a significant improvement in terms of speech recognition accuracy, when compared to the one of the best performing individual speech enhancement algorithm. This is expressed as accuracy gain of 3.3% in terms of word recognition rate. The advance offered in the present work reaches beyond the specifics of the present application, and can be beneficial to spoken interfaces operating in fast-varying noise environments.  相似文献   

15.
关存太  陈永彬 《电子学报》1995,23(12):52-58
本文给出了一个极低码率的60b/s的主意编码系统-汉语识别声码器,以32句话共267个音节作实验,其音节识别率平均为74.14%,句子平均可懂度为91.9%,介绍了其系统结构,给出了实验结果。  相似文献   

16.
This paper proposes a voice synthesizer to convert a single speech to multiple speeches. Pitch is an important voice characteristic of speech parameter and it is produced by the periodic vibration of the vocal-cords; the parameter most sensitive for human’s auditory sense. So if you change the pitch of the voice with several different scaling rates, you can produce several different voices at the same time with a voice. The Multiple-Speech Synthesizer will be used in diverse practical applications. The cheer synthesizer that makes group voice from a single voice would be such an example. You could also use the system for a troll toy, birthday song tracks, effect sounds in movies and plays, protection systems of houses, etc. Furthermore, the synthesizer could be used to imitate the voice of famous entertainers or cartoon characters, such as the Mask-man.
Myung Jin BaeEmail:
  相似文献   

17.
一种改进型MMSE语音增强方法   总被引:3,自引:0,他引:3  
蔡斌  郭英  李宏伟  龚成 《信号处理》2004,20(1):68-72
本文提出了一种改进型语音短时谱最小均方误差(MMSE)估计的增强方法。通过在每一帧及帧内每一频点对无音的概率(SAP)进行估计,得到Ephraim和MalahMMSE估计算法的改进形式。对增强后的语音客观和主观测试表明:在低信噪比条件下,相对于传统的谱减法和MMSE估计方法,这种改进的方法能更好的抑制背景噪声和残留的“音乐噪声”。  相似文献   

18.
从语音识别技术、语音合成技术、语义理解技术三个方面分析应用于移动智能终端中的语音交互技术的发展现状,提出当前语音交互技术中存在的一些技术难点,并针对这些技术难点展望了语音交互技术的发展趋势。  相似文献   

19.
信息科学的发展对电子设备的技术水平提出了更高的要求,语音识别系统将是车载、机载综合电子设备中一项不可缺少的内容。本文从实际需求出发,力求找到一种适宜于小平台机载环境下的语音识别及相关算法,构建面向实际应用的基于DSP的机载高速、高可靠性音频处理硬件平台。  相似文献   

20.
王晓亨  陆宇平 《信息技术》2007,31(1):1-3,19
在无线局域网环境中,建立了一套以移动机器人为控制对象的、模拟Internet传输特征的远程控制技术研究平台。通过可视化的人机接口界面,可以直接向远端机器人发送控制指令,并能看到反馈的状态数据;还可通过手柄控制,语音控制、命令集可编程接口等方式控制机器人。最后的开发实例具有操作简便、界面友好、易于扩展等特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号