首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 156 毫秒
1.
嵌入式语音识别系统的研究和实现   总被引:9,自引:1,他引:9  
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难,并指出了今后相关的研究方向。  相似文献   

2.
在SEED-DEC5502DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,和传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用。系统采用改进的基于语音对数域能量变化率的实时端点检测算法,只对检测的有声段语音进行特征提取,从而减少了要处理的语音帧数;提出了改进的共享声学单元状态发射概率共享的解码策略,进一步降低了计算负担。实验表明系统在100词条的情况下识别率达到98.1%,识别时间为1.03倍实时。  相似文献   

3.
本文介绍了一种基于TMS320C6711 DSP的非特定人、孤立词语音识别系统。本文首先介绍了语音识别技术的基本原理,然后对不同的识别算法在多种嵌入式系统平台上进行性能分析和比较,可得到本语音识别系统具有较高的识别率、实时性和鲁棒性。  相似文献   

4.
分析嵌入式语音识别系统设计的要点,提出了一种基于凌阳SPCE061A单片机的嵌入式特定人语音识别系统,重点讨论了嵌入式语音识别系统的相关算法及系统组成。该系统识别率高,价格低廉,可移植性好,已成功应用于智能机器人控制平台。  相似文献   

5.
嵌入式语音识别系统性能分析   总被引:1,自引:1,他引:0  
语音识别技术在嵌入式系统上的应用是当前的热点和难点。本文在三种不同的嵌入式系统上建立了基于HMM的非特定人大词汇表连续语音识别的实验平台,对语音识别的实时性能进行了测试分析,讨论了非特定人连续语音识别系统在不同嵌入式平台上的可行性。  相似文献   

6.
孤立字词识别   总被引:6,自引:0,他引:6  
本文主要介绍了语音识别的一般方法和策略,对动态时间规整(DTW)算法的基本原理进行了说明,并利用该算法实现了一个简单的非特定人孤立字词识别系统。  相似文献   

7.
王维强 《计算机系统应用》2012,21(10):118-121,183
对多种隐马尔可夫模型算法进行了分析对比,在此基础上设计了一种改进的离散隐马尔可夫模型(DHMM)算法,并将此算法成功运用到了DSP嵌入式语音识别系统中.该系统采用上述算法完成了对非特定人的孤立词语音识别.该系统以ADSP-BF531语音处理专用DSP为核心,并辅以大容量的SDRAM和ROM为扩展,具有小型、高速、可靠、鲁棒性好、扩展性强等多个优点;可应用于许多特定场合,有很好的市场前景.试验结果表明,该系统对非特定人的孤立词的综合识别率在94%以上.对该系统应用的改进的DHMM算法,硬件的实现过程以及其实际应用效果等进行了详细阐述.  相似文献   

8.
小词汇量非特定人语音识别在嵌入式系统中的应用   总被引:5,自引:0,他引:5  
刘振安  孙捷  王晋军 《计算机工程》2006,32(11):213-215
给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可大模型方法实现语音识别系统。该系统适应性强,可扩展性好,具有一定的实时性和语言无关性。当在算法上针对汉语普通话进行优化后,则能进一步提高识别汉语的准确性和实时性。  相似文献   

9.
针对现有的非特定人语音识别系统存在词汇数据库庞大、训练过程复杂的问题,采用VC++实现了一种特定人语音识别算法。该算法采用先预加重后端点检测的方法来消除低频噪声的影响;选择短时能量和短时过零率2个指标作为语音信号端点检测的依据;加入了可容忍静音时间的判断来保证检测到的语音数据的完整性;采用改进的动态时间规整算法进行模式匹配,在不影响计算结果的前提下减少了运算量。测试结果表明,该算法能够对短词和短句进行实时、准确识别,并具有较快的识别速度。  相似文献   

10.
提出一种基于特定人的内窥镜自动定位语音识别系统,通过识别特定医生的语音控制口令实现内窥镜的定位,为手持内窥镜操作提供更加智能化的解决方案。在识别算法上提出了参考模板归一化平均的动态时间规划(Normalized Average-Dynamic Time Warping,NA-DTW)算法,可获得更高的识别率,系统以片上Windows?CE操作系统和ARM作为系统的软硬件平台。实验通过对10个不同测试人的共1 250组测试数据进行识别检测,NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469 ms缩短到241 ms。验证了NA-DTW算法可以完成基于特定人、孤立词的语音识别功能,并满足嵌入式系统中的实时检测条件。  相似文献   

11.
Audio-visual speech recognition (AVSR) using acoustic and visual signals of speech has received attention because of its robustness in noisy environments. In this paper, we present a late integration scheme-based AVSR system whose robustness under various noise conditions is improved by enhancing the performance of the three parts composing the system. First, we improve the performance of the visual subsystem by using the stochastic optimization method for the hidden Markov models as the speech recognizer. Second, we propose a new method of considering dynamic characteristics of speech for improved robustness of the acoustic subsystem. Third, the acoustic and the visual subsystems are effectively integrated to produce final robust recognition results by using neural networks. We demonstrate the performance of the proposed methods via speaker-independent isolated word recognition experiments. The results show that the proposed system improves robustness over the conventional system under various noise conditions without a priori knowledge about the noise contained in the speech.   相似文献   

12.
A log-index weighted cepstral distance measure is proposed and tested in speacker-independent and speaker-dependent isolated word recognition systems using statistic techniques.The weights for the cepstral coefficients of this measure equal the logarithm of the corresponding indices.The experimental results show that this kind of measure works better than any other weighted Euclidean cepstral distance measures on three speech databases.The error rate obtained using this measure is about 1.8 percent for three databases on average,which is a 25% reduction from that obtained using other measures,and a 40% reduction from that obtained using Log Likelihood Ratio(LLR)measure.The experimental results also show that this kind of distance measure woks well in both speaker-dependent and speaker-independent speech recognition systems.  相似文献   

13.
根据不同人发相同音节时,一个基音周期内的波形具有一定相似性的特点,提出一种新的基音周期标准化的语音信号预处理方法。该方法在一个嵌入式的、非特定人、孤立数字的语音识别系统中进行了验证,实验结果表明基音周期标准化能有效提高语音识别的准确率。  相似文献   

14.
In spite of recent advances in automatic speech recognition, the performance of state-of-the-art speech recognisers fluctuates depending on the speaker. Speaker normalisation aims at the reduction of differences between the acoustic space of a new speaker and the training acoustic space of a given speech recogniser, improving performance. Normalisation is based on an acoustic feature transformation, to be estimated from a small amount of speech signal. This paper introduces a mixture of recurrent neural networks as an effective regression technique to approach the problem. A suitable Vit-erbi-based time alignment procedure is proposed for generating the adaptation set. The mixture is compared with linear regression and single-model connectionist approaches. Speaker-dependent and speaker-independent continuous speech recognition experiments with a large vocabulary, using Hidden Markov Models, are presented. Results show that the mixture improves recognition performance, yielding a 21% relative reduction of the word error rate, i.e. comparable with that obtained with model-adaptation approaches.  相似文献   

15.
本文介绍了在连续语音识别和语音机器翻译方面所进行的工作。我们已在中等词汇量范围、限定说话主题的条件下,实现了特定人的连续话句的识别。并实现了一个英汉语音翻译实验演示系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号