首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
毕继武  韩纪庆 《计算机科学》2002,29(12):150-153
1 引言话者在心理紧张和情绪变化时语音会发生变异,如在身体不适(如感冒)时、恐惧、愤怒、环境噪声影响下,以及生理情况受到影响(如加速度变化)时,其语音都会发生改变。发音变异可以引起各语音参数的不同变化,以致常规语音识别系统的识别率大大下降。从八十年代末开始,就有人研究顽健(ro-bust)语音识别问题,针对噪声下的研究工作已经取得了非常显著成效,但针对应力影响下变异语音识别的研究则很有限。应力影响下变异语音识别是一个难度较大的问题,因为应力影响同人的发音过程具有直接的物理关系,其所引起的发音  相似文献   

2.
讨论由说话人引起的声学差异基础上,研究两种基于模型的自适应算法最大似然线性回归(MLLR)和最大后验概率(MAP)。实验结果表明,不论采用哪种自适应都能使识别率有一定的提升。两种算法之间的差异性在于MAP具有良好的渐进性,但收敛性较差,而MLLR在很大程度上改善了收敛特性,但其渐进特性却不如MAP。  相似文献   

3.
基于MAP和MLLR的综合渐进自适应方法研究   总被引:1,自引:0,他引:1  
从说活人自适应技术讨论了最大后验概率(MAP)和最大似然线性回归(MLLR)两种经典的说活人自适应方法,通过在渐进的MAP方法中引入一个简化的MLLR模块,提出一种适合于强健语音识别的快速综合渐进自适应语音识别方法和策略。  相似文献   

4.
应力影响下的变异语音是由于说话人受到重力加速度变化而产生的,与正常语音相比,变异语音频谱能量在频带范围内分布更加分散。把整个频带划分成8个子带,采用子带频谱能量的比值为特征,提出一种基于子空间方法的正常/变异语音分类方法。该方法采用CLAFIC方法设计初始向量子空间,并通过LSM算法对两类样本子空间按不同的旋转方式训练,用预分类的结果调整分类器的参数来改善分类器的性能。实验结果表明,该方法对应力影响下的变异语音与正常语音具有良好分类效果,平均分类正确率达到了95.9%。  相似文献   

5.
文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正Mel频率映射的MFCC特征改进了变异语音的识别性能。  相似文献   

6.
介绍一种融合最大后验概率算法和改进的高阶倒谱归整的抗噪声语音识别方法。将最大后验概率算法用于特征空间来估计电话通道特性(通道差的估计),用分段高阶倒谱归整进行后续补偿,可以同时减少电话语音中卷积噪声和加性噪声的影响。实验结果验证了该方法的有效性,与传统的倒谱均值减相比,训练库中识别率从46.3%提高到87.5%。  相似文献   

7.
在基于语音识别的智能家居中,用于训练的语料库不完备且应用场景复杂,自然语言语音识别错误接受率远远高于小词汇的语音识别的错误接受率.作者在设计与实现基于自然语言的语音识别智能家居系统的过程中,深入研究了MAP、MLLR算法在基于HMM声学模型参数中的作用,提出了一种综合的自适应方法,并基于开源的语音识别工具CMU SPHIN最终完整的实现了该系统,结果表明所提出的自适应新算法可行有效,较好改善了系统在不同场景中的性能.  相似文献   

8.
针对离散隐马尔可夫(Discrete Hidden Markov Model,DHMM)语音识别系统中LBG算法对初始码书的依赖性和易陷入局部最优解的问题,采用人工蜂群(Artificial Bee Colony,ABC)算法对语音特征参数进行矢量量化,从而得到最优码书,提出了ABC改进DHMM的孤立词语音识别方法。先提取语音信号的特征参数,然后用ABC算法中每个食物源表示一个码书,以人工蜂群进化的方式对初始码书进行迭代而获得最优码书,最后把最优码书的码矢标号代入DHMM模型进行训练和识别。实验结果表明,ABC改进的DHMM语音识别方法与传统的LBG及粒子群优化初始码书的LBG的DHMM语音识别方法相比具有较高的识别率和较好的鲁棒性。  相似文献   

9.
基于特征加权的应力影响下顽健语音识别方法   总被引:1,自引:0,他引:1  
通过对应力影响下语音数据的分析,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感,相应的高维特征敏感程度差些。在此基础上,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验,最大相对熵估计方法的识别率可达到89.9% ,与多重风格训练方法相比,识别率提高了13.1%。  相似文献   

10.
黄盈椿  王欢良  冯涛 《计算机工程》2006,32(20):203-204
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。  相似文献   

11.
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。
  相似文献   

12.
为了准确提取语音基频,设计了一种新的基频提取算法,并对此算法的抗噪性能进行了评估,同一段语音进行加噪和未加噪两类处理,通过实验提取两类语音的基频,以未加噪基频作为准标值,对不同信噪比的语音基频与准标值的偏离情况进行了分析,从而了解算法提取基频的抗噪性。以便全面掌握此算法的性能,达到优化算法,减小估计带来的误差,提高语音基频提取的目的。  相似文献   

13.
语音信号的基音标注算法   总被引:2,自引:0,他引:2  
阐述了一种连续语音的最大幅度的基音标注算法,这种算法运用自相关算法原理和动态编程的思想,不必区分清音区域和浊音区域,能在一段连续的语音信号中自动地标记基音位置,实验证明,这种算法对基音同步叠加合成系统的语音分析很有用途。  相似文献   

14.
众所周知,训练和测试环境的不同严重影响了语音识别系统的性能。该文提出了一种新的测试环境自适应的方法,它能在测试进行过程中逐步地学得环境特征,而不需要事先获得测试环境的样本数据,从而改变了语音识别系统性能。  相似文献   

15.
一种基于MAP的超分辨率图像重建的快速算法   总被引:3,自引:0,他引:3  
超分辨率图像重建技术就是通过融合多幅变形、模糊、有噪、频谱混叠的低分辨率降质图像(或视频序列)来重建一幅高质量高分辨率图像.MAP估计算法是一种广泛使用的统计重建方法.针对标准MAP估计算法运算量大的问题提出了两点改进.第1点是当计算梯度时直接计算目标函数的增量,避免了函数值的冗余计算;第2点是采用非精确一维搜索确定步长,避免了运算量庞大的海塞矩阵的计算.实验结果表明,提出的改进在保持重建效果基本不变的前提下,在很大程度上提高了MAP超分辨率图像重建方法的速率,与此同时保证了算法的收敛性.  相似文献   

16.
研究了一种基于深度置信网络的语音增强算法,并针对其不足做如下改进:考虑到对应训练集中噪声种类较少,噪声特性不够丰富的情况,在频域对噪声频谱进行扰动,以丰富噪声频谱特性;考虑到不同频点的信号对系统误差的影响不一样,结合绝对听阈构造权重系数。最后选取在噪声环境下传统语音增强算法中较好的LOG-MMSE和本文改进的基于深度置信网络的语音增强算法进行了分析比较,结果证明深度置信网络的语音增强算法显示出较好性能,尤其对增强后语音质量的提升超过了LOG-MMSE方法。  相似文献   

17.
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术用在远场噪声混响环境下来分析其在此环境下的识别性能。实验结果表明,仿真条件下,在墙壁反射系数为0.6,各种噪声环境下MAP有最好的自适应性能,在信噪比(Signal-to-Noise Ratio,SNR)分别为5 dB、10 dB、15 dB时,MAP使远场连续语音词错率(Word Error Rate,WER)平均降低了1.51%、12.82%、2.95%。真实条件下,MAP使WER下降幅度最大达到了37.13%。进一步验证了MAP良好的渐进性,且当自适应句数为1 000时,用MAP声学模型自适应方法得到的远场噪声混响连续语音的识别词错率比自适应前平均降低了12.5%。  相似文献   

18.
为了解决语音识别中深层神经网络的说话人与环境自适应问题,本文从语音信号中的说话人与环境因素的固有特点出发,提出了使用长时特征的自适应方案:首先基于高斯混合模型,建立说话人-环境联合补偿模型,对说话人与环境参数进行估计,将此参数作为长时特征;然后,将估计出来长时特征与短时特征一起送入深层神经网络,进行训练。Aurora4实验表明,这一方案可以有效地对说话人与环境因素进行分解,并提升自适应效果。  相似文献   

19.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号