首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
论文旨在研究基于MATLAB平台的特定人孤立词小词汇量的语音识别系统的实现。文章分别对语音信号的预处理过程、语音信号的特征提取及语音信号的识别算法等方面进行深入研究和分析在端点检测过程中,使用短时能量和过零率双门限进行检测,应用识别率较高的MFCC作为特征参数,针对传统DTW算法在语音识别中测试语音与参考语音模板匹配所需时间较长的问题,提出搜索路径改进算法,使得算法的运算速度有所提升。为了提升DTW的识别率,提出改进的模板匹配方法——多模板匹配方法。实验结果证明,采用改进算法的语音识别系统有效地降低了识别时间,提高了系统的识别率。  相似文献   

2.
在分析语音识别原理的基础上采用TMS320DM642 DPS芯片,利用前向-后向HMM声学模型和Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统.实验结果表明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到96.8%及91.2%,该语音识别系统具有良好的实用性和可移植性.  相似文献   

3.
基于DSP的嵌入式语音识别系统的实现   总被引:8,自引:1,他引:7  
李鹏怀  徐佩霞 《计算机工程》2005,31(16):160-162
设计并实现了一种嵌入式语音识别系统。硬件核心处理器是ADSP2181,语音接口芯片为AD1847。软件模块包括语音端点检测、MFCC求取、动态时间弯折算法、识别结果判定、模板训练等。系统使用定点DSP实现了浮点DSP运算,提高了运算的精度,扩大了信号处理的动态范围。实验结果表明,该系统对孤立词特定人的识别率为98%。它可用于声控玩具、智能家电等,具有较大的市场应用价值。  相似文献   

4.
系统采用凌阳SPCE061A单片机作为语音识别系统的主控芯片.通过硬件电路设计和软件代码部分成功的设计并实现了一种具有语音识别功能、语音提示(语音合成)及语音回放(语音编码记录)功能的嵌入式语音识别系统.语音识别模型采用(DHMM)离散隐马尔可夫模型,利用Baum-welth重估算法、前向后向算法、viterbi算法来完成语音模板的训练和语音识别的任务.  相似文献   

5.
《计算机工程》2018,(1):199-205
为提高普米语语音识别系统的性能,引入深度学习模型进行普米语语音识别,该模型是一个高容量复杂的网络模型。以Kaldi语音识别工具包为实验平台,分别训练5种不同的声学模型,且这5种模型中包含一个有4隐层的深度神经网络模型。比较不同声学模型得到的语音识别率发现,G-DNN模型比Monophone模型的语音识别率平均提升49.8%。实验结果表明,当增加训练集的普米语语音语料量时,基于深度学习的普米语语音识别率会提升,而基于深度学习的普米语语音识别系统的鲁棒性比其余4个声学模型的普米语语音识别系统的鲁棒性更强。  相似文献   

6.
变异情况对语音的影响是导致语音识别系统性能下降的原因之一。一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想。利用自适应算法可以解决这类问题,它采用少量的测试环境数据进行训练,以达到训练模型和测试数据匹配的目的,保证系统良好的识别性能。MAP算法是常用的自适应算法,大多应用于话者自适应环境,该文尝试将其应用于变异语音识别系统中,并通过对该模型做相应改进获得了较好的识别结果。在小词表特定人应力变异的识别实验中,分别用非特定人模型和改进的特定人模型作为初始模型,应用MAP算法,系统识别率均有明显提高,与基本识别系统相比,在10遍自适应数据前提下,识别率分别提高了15.84%和15.97%,最好的识别率达到85.56%和90.42%。  相似文献   

7.
基于RBF神经网络的抗噪语音识别   总被引:1,自引:0,他引:1  
针对目前在噪音环境下语音识别系统性能较差的问题,利用RBF神经网络具有最佳逼近性能、训练速度快等特性,分别采用聚类和全监督训练算法,实现了基于RBF神经网络的抗噪语音识别系统。聚类算法的隐含层训练采用K-均值聚类算法,输出层的学习采用线性最小二乘法;全监督算法中所有参数的调整基于梯度下降法,它是一种有监督学习算法,能够选出性能优良的参数。实验表明,在不同的信噪比下,全监督算法较之聚类算法有更高的识别率。  相似文献   

8.
为有效提高语音情感识别系统的识别率,研究分析了一种改进型的支持向量机(SVM)算法。该算法首先利用遗传算法对SVM参数惩罚因子和核函数中参数进行优化,然后用优化后的参数进行语音情感的建模与识别。在柏林数据集上进行7种和常用5种情感识别实验,取得了91.03%和96.59%的识别率,在汉语情感数据集上,取得了97.67%的识别率。实验结果表明该算法能够有效识别语音情感。  相似文献   

9.
周萍  唐李珍 《计算机工程》2011,37(2):169-171
针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果相结合,最终输出识别结果。利用信号分解的方法,实现待测语音信号的重复识别,同时采用决策层融合算法优化识别结果,从而在短训练语音情况下,使系统的识别率得到保障。实验结果表明,该算法在短训练语音识别系统中的识别效果优于传统方法。  相似文献   

10.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用。为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法。在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容。最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论。  相似文献   

11.
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率.  相似文献   

12.
在基于语音识别的智能家居中,用于训练的语料库不完备且应用场景复杂,自然语言语音识别错误接受率远远高于小词汇的语音识别的错误接受率.作者在设计与实现基于自然语言的语音识别智能家居系统的过程中,深入研究了MAP、MLLR算法在基于HMM声学模型参数中的作用,提出了一种综合的自适应方法,并基于开源的语音识别工具CMU SPHIN最终完整的实现了该系统,结果表明所提出的自适应新算法可行有效,较好改善了系统在不同场景中的性能.  相似文献   

13.
针对现有的非特定人语音识别系统存在词汇数据库庞大、训练过程复杂的问题,采用VC++实现了一种特定人语音识别算法。该算法采用先预加重后端点检测的方法来消除低频噪声的影响;选择短时能量和短时过零率2个指标作为语音信号端点检测的依据;加入了可容忍静音时间的判断来保证检测到的语音数据的完整性;采用改进的动态时间规整算法进行模式匹配,在不影响计算结果的前提下减少了运算量。测试结果表明,该算法能够对短词和短句进行实时、准确识别,并具有较快的识别速度。  相似文献   

14.
提出一种基于特定人的内窥镜自动定位语音识别系统,通过识别特定医生的语音控制口令实现内窥镜的定位,为手持内窥镜操作提供更加智能化的解决方案。在识别算法上提出了参考模板归一化平均的动态时间规划(Normalized Average-Dynamic Time Warping,NA-DTW)算法,可获得更高的识别率,系统以片上Windows?CE操作系统和ARM作为系统的软硬件平台。实验通过对10个不同测试人的共1 250组测试数据进行识别检测,NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469 ms缩短到241 ms。验证了NA-DTW算法可以完成基于特定人、孤立词的语音识别功能,并满足嵌入式系统中的实时检测条件。  相似文献   

15.
蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程.针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题.对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BL...  相似文献   

16.
针对语音识别系统对实时性和便携性的要求,提出一种基于MFCC/SVM在DM6446嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统,将有向无环图多类分类支持向量机算法移植到该平台。并在该平台用DAG方法对非特定人孤立词和连接词进行语音识别,比隐马尔可夫模型有明显优势。通过样本预选取算法对训练样本进行预选取处理,并且应用到嵌入式语音识别系统中,大大降低了训练时间和测试时间。  相似文献   

17.
One serious difficulty in the deployment of wideband speech recognition systems for new tasks is the expense in both time and cost of obtaining sufficient training data. A more economical approach is to collect telephone speech and then restrict the application to operate at the telephone bandwidth. However, this generally results in suboptimal performance compared to a wideband recognition system. In this paper, we propose a novel expectation-maximization (EM) algorithm in which wideband acoustic models are trained using a small amount of wideband speech and a larger amount of narrowband speech. We show how this algorithm can be incorporated into the existing training schemes of hidden Markov model (HMM) speech recognizers. Experiments performed using wideband speech and telephone speech demonstrate that the proposed mixed-bandwidth training algorithm results in significant improvements in recognition accuracy over conventional training strategies when the amount of wideband data is limited  相似文献   

18.
抗噪声语音识别及语音增强算法的应用   总被引:1,自引:0,他引:1  
汤玲  戴斌 《计算机仿真》2006,23(9):80-82,143
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。  相似文献   

19.
Obtaining training material for rarely used English words and common given names from countries where English is not spoken is di?cult due to excessive time, storage and cost factors. By considering pe...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号