共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
3.
针对传统语音增强方法在非平稳噪声环境下增强效果不理想的问题,提出了一种基于稀疏约束的概率潜分量分析(PLCA)和谱掩蔽的语音增强算法。该算法分为训练和增强两个阶段。训练阶段用稀疏约束的PLCA(SPLCA)和无约束的PLCA分别对语音谱和噪声谱建模成意义清晰的边缘分布,并用期望最大(EM)算法求其最优边缘分布,得到语音字典和噪声字典。增强阶段固定训练的字典,利用SPLCA推导出对应的语音编码矩阵和噪声编码矩阵,初步重构出语音和噪声,最后利用谱掩蔽得到增强语音。实验结果表明,该算法在抑制噪声、提高信噪比和减少语音失真方面要优于传统方法。 相似文献
4.
5.
本文提出了一种基于HMM和匹配追踪的多参数语音识别新算法。首先构建局部余弦基表示语音信号,对其进行匹配追踪(MP)分解。然后,应用改进后的算法对语音信号进行特征提取,得到余弦基原子参数和魏格纳-维利(WVD)分布,并结合语音信号的美尔频率倒谱系数(MFCC)一起作为该信号的特征向量,通过隐马尔科夫模型(HMM)进行识别。最后通过实验验证了方法的有效性,仿真实验表明,改进后的多参数语音识别算法比仅使用MFCC作为特征向量的HMM算法,提高了语音识别的速度和准确度。 相似文献
6.
7.
8.
应用于语音识别片上系统的语音检测算法 总被引:2,自引:0,他引:2
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。 相似文献
9.
递归趋势分析在汉语语音声韵母切分中的应用研究 总被引:1,自引:0,他引:1
基于隐马尔可夫模型(HMM)的连续语音自动切分方法由于较高的切分精度得到了广泛的应用,然而其切分结果还不能够直接应用于基于脚本的语音拼接合成系统,需要音素边界的再调整。本文分析了不同的汉语语音音素的非线性动力学物理模型在其递归图(RP)上的表现,通过递归趋势(RT)这一衡量系统稳定性程度的量化参数,揭示了语音产生过程中的不稳定性。结合基于HMM的连续语音初始切分结果,从定位语音动力学特性突变点的角度,调整声韵母切分边界,在10、20、30毫秒基准范围内,切分精度分别提高了13.88%、4.19%、3.19%。 相似文献
10.
11.
12.
激光麦克风是一种利用光学多普勒效应获取远场语音信息的技术,其语音质量受到探测系统自身特性、光探测路径以及目标物等多个方面的影响。为了从远距离声场下的目标物获取更高质量的语音信息,文中通过单频声激励实验获得了4种典型目标物(A4纸片、A4纸盒、瓦楞盒、塑料瓶)的声致振动频率响应,发现了其在频率上的非均匀性。在此基础上,提出了一种基于ResUnet和TFGAN网络的激光语音增强方法,其通过ResUnet网络预测去噪梅尔谱图,并利用TFGAN网络由预测的梅尔谱图恢复出激光语音的时域波形。然后,利用实验室自制的激光麦克风在4种目标物上进行了远距离语音采集实验,采用文中提出的方法对采集到的激光麦克风语音进行了处理,并与非线性函数谐波重构法、DNN+谐波重构法进行了比较。最后利用客观语音质量评估(PESQ)和时域分段信噪比(SNRseg)对处理后的激光语音进行了量化评估。实验结果表明,在4种目标物上采集到的激光语音,经过非线性函数谐波重构方法和DNN+谐波重构方法处理后,语音质量均无明显提升,其相应的PESQ和SNRseg分值无明显提高。而经过文中所提的ResUnet+TFGAN网络方法处理后,激光语音取得了更高的PESQ和SNRseg分值,语音质量明显提升。因此,文中提出的方法在激光麦克风应用中具有更好的激光语音增强效果。此外,由实验结果可知,此方法在频率响应一致性较差的目标物上,仍然可以较好地重建频谱,恢复出高质量的语音信息。 相似文献
13.
14.
语音业务中鲁棒性VAD算法分析 总被引:4,自引:0,他引:4
采用话音激活检测(Voiced Activity Detection,VAD)技术的目的是检测语音通信时是否有话音存在,检测到静音时加以抑制,使其不占用或极少占用信道带宽,检测到话音时才对其进行压缩编码与传输.鲁棒性语音识别系统、数字移动通信和因特网实时语音传输等领域要求在恶劣声学环境条件下进行VAD检测,以节省带宽并抑制噪声,因此VAD技术是目前语音处理领域的重要问题.文中给出的几种最新VAD算法(EZCR-VAD,STAT-VAD和E-VAD)是在低信噪比环境下的话音检测具有很好的鲁棒性的算法. 相似文献
15.
16.
11月4日,语音和数据网络的模拟/混合信号IC的主要供应商力捷(Legerity)半导体在京举办新闻发布会,副总裁埃里克·布鲁克曼(Eric Broockman)宣布了在华战略,及介绍了推出的新产品。11月1日,公司已宣布其新的亚洲总部在上海正式成立。该办事处将作为力捷半导体公司在亚洲的主要业务基地,重点放在大中华区市场。力捷将利用其VoiceChipTM系列宽带语音(VoB)IC和芯片组,寻求在亚洲的宽带语音设备设计机会,同时继续向中国的局用交换机(CO)和数字回路载波系统(DLC)设备制造商提供业内领先的模拟线路板解决方案。力捷也为亚洲的宽带、… 相似文献
17.
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e. 相似文献
18.
19.
引言 语音信号处理应包括:语音通信(人讲话、人听话)、语音识别(人讲话、机器听话)和语音合成(机器讲话、人听话)三类。 语音通信是指人讲了话形成语音信号之后,如何通过机器进行变换(压缩)和传输,最后到达人耳之前的处理过程。关键是解决语音质量与 相似文献
20.
提出了一种谱扩展算法,先对窄带语音进行线性预测编码(LPC)分析和多带激励(MBE)分析,得到窄带语音的线性谱频率(LSF)参数和清/浊音(U/V)判决信息;利用高斯混合模型(GMM)由窄带语音的LSF参数扩展得到高带语音的包络谱信息;对于激励信号,由窄带语音的U/V判决信息通过码本匹配得到高带的U/V判决,然后根据U/V判决信患由正弦模型合成出高带激励信号,并进而由LPC方法生成高带语音。最终的宽带语音由原始窄带语音和扩展得到的高带语音经子带合成得到.实验结果表明该算法扩展得到的宽带语音能有效提高语音信号的清晰度和可懂度。 相似文献