首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
介绍了一种小词汇量的语音识别方法。在传统的DTW语音识别的基础上,通过放宽端点、对路径进行斜率限制和改进局部路径限制等方法,使系统能够实现快速的识别响应,尤其是对于小词汇量和特定人识别,可以有效地提高响应速度和识别率。  相似文献   

2.
语音识别是实现人机通信的一种重要技术手段.本文基于Samsung公司开发的B lues芯片,应用隐马尔可夫模型(HMM)理论和方法,完成了针对特定人、小词汇量嵌入式语音识别系统开发.文章介绍了语音识别过程的各个环节及其实现方法.  相似文献   

3.
基于DSP的语音识别系统的设计与实现   总被引:2,自引:0,他引:2  
一种基于定点数字信号处理器TMS320VC5402的实时语音识别系统。能够实现非特定人、小词汇表、孤立词的语音识别。系统以线性预测倒谱参数为特征参数,采用动态时间归整识别模型,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人情况下正识率在93%以上。  相似文献   

4.
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

5.
系统以16位数字信号处理器TMS320VC5502为核心,采用音频Codec芯片TLV320AIC23对语音信号进行采集和编码转换,通过端点检测、特征参数提取、DTW算法等关键技术实现特定人、小词汇量、孤立词的语音识别,最终根据LED闪灯次数检测数字0~9的识别结果。  相似文献   

6.
为了解决连续的语音识别对端点的依赖性问题,提出了一种基于高维空间点覆盖动态搜索理论的非特定人问候语连续语音识别的新算法,该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小来判断识别结果.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

7.
为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识别的实验,证实了该方法的有效性.  相似文献   

8.
本设计采用语音识别和GSM远程报警技术使防盗系统智能化,安全性提高。该智能门控系统基于凌阳16位单片机SPCE061A为控制核心,将语音信号进行数字信号处理,利用特定人语音识别技术实现语音识别密码锁功能,并利用GSM模块实现无线远程短信和拨号报警功能。从硬件设计、软件优化等方面进行总体设计,并且通过结果测试和分析证明了设计的可行性。  相似文献   

9.
针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值.  相似文献   

10.
将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对语谱图进行等宽度分带行投影和二进宽度分带行投影,分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。将上述3个特征集构造为特定人二字汉语词汇识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,该方法对特定人二字汉语词汇的识别率可达92.8%,为汉语词汇的识别提供了新的思路。  相似文献   

11.
Linear discriminant analysis and kernel vector quantization are integrated into vector quantization based speech recognition system for improving the recognition accuracy of Mandarin digits. These techniques increase the class separability and optimize the clustering procedure. Speaker-dependent (SD) and speaker-independent (SI) experiments are performed to evaluate the performance of the proposed method. The experiment results show that the proposed method is capable of reaching the word error rate of 3.76 % in SD case and 6.60 % in SI case. Such a system can be suitable for being embedded in personal digital assistant(PDA), mobile phone and so on to perform voice controlling such as digit dialing, calculating, etc.  相似文献   

12.
Mandarin Digits Speech Recognition Using Support Vector Machines   总被引:1,自引:0,他引:1  
A method of applying support vector machine (SVM) in speech recognition was proposed, and a speech recognition system for mandarin digits was built up by SVMs. In the system, vectors were linearly extracted from speech feature sequence to make up time-aligned input patterns for SVM, and the decisions of several 2-class SVM classifiers were employed for constructing an N-class classifier. Four kinds of SVM kernel functions were compared in the experiments of speaker-independent speech recognition of mandarin digits. And the kernel of radial basis function has the highest accurate rate of 99.33 %, which is better than that of the baseline system based on hidden Markov models (HMM) (97.08%). And the experiments also show that SVM can outperform HMM especially when the samples for learning were very limited.  相似文献   

13.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

14.
An extended phonemic set of mandarin from the view of speech recognition is proposed. This set absorbs most principles of some other existing phonemic sets for mandarin, like Worldbet and SAMPA-C, and also takes advantage of some practical experiences from speech recognition research for increasing the discriminability between word models. And the experiments in speaker independent continuous speech recognition show that hidden Markov models defined by this phonemic set have a better performance than those based on initial/final units of mandarin and have a very compact size.  相似文献   

15.
At present ,the trend to ever-increasing use ofdata communication is spreading to the mobile wire-less world. The small portable devices will be used toaccess these data and cry out for i mproved user inter-faces using speechinput , whichis very i mportan…  相似文献   

16.
针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法.首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特征参数;最后,根据朝鲜语数字串发音特点,即若前1个孤立词已被识别为数字,那么后1个被默认为单位符并且只与存储单位符号的模板进行匹配.实验结果表明,该方法不仅可以获得较高的正确识别率,同时提高了识别效率.  相似文献   

17.
讨论了半连续隐马尔可夫模型(SCHMM)及其在孤立数字语音识别中的应用.提出了一种新的 Viterbi 分段统计算法来估计 SCHMM 参数,降低了模型参数估计的计算量,提高了识别率.  相似文献   

18.
非线性主分量分析PCA算法与子空间模式识别方法相结合,提出了一种应用于手写体字符识别的基于非线性PCA神经网络的信号重构模型,并与BP网络模型进行了比较实验,结果表明,本文提出的方法,对于0~9手写体数字识别,正确识别率达到了94.74%,而对于a~z手写体字符识别,正确识别率达到了91.03%.  相似文献   

19.
Some channel compensation techniques integrated into front-end of speech recognizer for improving channel robustness are described. These techniques include cepstral mean normalization, rasta processing and blind equalization. Two standard channel frequency characteristics, G. 712 and MIRS, are introduced as channel distortion references and a mandarin digit string recognition task is performed for evaluating and comparing the performance of these different methods. The recognition results show that in G. 712 case blind equalization can achieve the best recognition performance while cepstral mean normalization outperforms the other methods in MIRS case which is capable of reaching a word error rate of 3.96 %.  相似文献   

20.
本文介绍一个根据汉语特点进行汉语连读数字音识别的新方法。它首先应用模式识别原理将待识别数字串分割为单个数字,再用一种联合式方法识别每个数字。实验研究表明:本文提出的分段和识别方法对汉语连续语音识别也是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号