首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能.  相似文献   

2.
DSP语音识别电梯控制系统的设计和实现   总被引:1,自引:1,他引:0  
针对多人乘坐电梯时按键不是很方便的问题,设计了一种简单的DSP语音识别电梯控制系统。以TMS320C6713 DSP芯片作为系统运算控制中心,TLV320AIC23B芯片作为语音输入、输出的模拟前端,EP2C5Q208C8 FPGA芯片作为系统IO扩展,以这3个部分的有机结合实现了非特定人、孤立词、小词汇量的嵌入式语音识别电梯控制。测试结果显示:所设计的系统结构合理,语音识别电梯控制准确度达8 0%。  相似文献   

3.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

4.
为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识别的实验,证实了该方法的有效性.  相似文献   

5.
介绍了一种小词汇量的语音识别方法。在传统的DTW语音识别的基础上,通过放宽端点、对路径进行斜率限制和改进局部路径限制等方法,使系统能够实现快速的识别响应,尤其是对于小词汇量和特定人识别,可以有效地提高响应速度和识别率。  相似文献   

6.
为了研究语音识别技术的实用化问题.采用离散隐马尔可夫模型方法,基于单片微控制器加数字信号处理器(MCU DSP)构架,实现了一个非特定人语音指令识别系统.该系统适应性强,每个指令识别时间在1s内,准确率达到96%.  相似文献   

7.
针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值.  相似文献   

8.
设计一种基于语音识别技术的便携式语音提示器,采用STC90LE52系列单片机作为核心处理器,采用ICRoute公司生产研发的LD3320语音识别芯片实现语音识别功能.该系统属于非特定人语音识别,识别关键词列表可以由用户自己进行动态编辑.并对该语音识别系统的总体结构、主控制模块和语音识别模块的软硬件设计进行详细阐述.实验结果表明:该系统识别准确率高,结构简单,性价比高,具有较高的推广应用价值.  相似文献   

9.
将几种不同的分级结构神经网络用于非特定人的汉语孤立音识别,比较了它们的不同性能,实验结果表明,针对一定词汇表,确定适合的分极结构,可以使非特定人的语音识别达到较高的识别率。  相似文献   

10.
系统以16位数字信号处理器TMS320VC5502为核心,采用音频Codec芯片TLV320AIC23对语音信号进行采集和编码转换,通过端点检测、特征参数提取、DTW算法等关键技术实现特定人、小词汇量、孤立词的语音识别,最终根据LED闪灯次数检测数字0~9的识别结果。  相似文献   

11.
不定人语音识别系统   总被引:1,自引:0,他引:1  
采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型DHMM孤立字语音识别系统中,采用了3种说话人自适应方法,方法1,方法2为码本自适应,方法3为新人数据自适应,并将新建的1000人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高16%,达到93%以上;在数据库的采用,使得不定人的数字识别率达到  相似文献   

12.
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能.  相似文献   

13.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

14.
Based on an auditory model, the zero-crossings with maximal Teager energy operator (ZCMT) feature extraction approach was described, and then applied to speech and emotion recognition. Three kinds of experiments were carried out. The first kind consists of isolated word recognition experiments in neutral (non-emotional) speech. The results show that the ZCMT approach effectively improves the recognition accuracy by 3.47% in average compared with the Teager energy operator (TEO). Thus, ZCMT feature can be considered as a noise-robust feature for speech recognition. The second kind consists of mono-lingual emotion recognition experiments by using the Taiyuan University of Technology (TYUT) and the Berlin databases. As the average recognition rate of ZCMT approach is 82.19%, the results indicate that the ZCMT features can characterize speech emotions in an effective way. The third kind consists of cross-lingual experiments with three languages. As the accuracy of ZCMT approach only reduced by 1.45%, the results indicate that the ZCMT features can characterize emotions in a language independent way.  相似文献   

15.
随着语音识别技术的发展,孤立词、小词汇量的语音识别系统在日常生活中得到广泛应用,本文提出了一种基于DSP的孤立词实时语音识别系统,并将动态时间规整技术运用到识别算法中。根据楼宇控制系统的特点,结合BACnet网络协议,把系统设计成BACnet设备的一个嵌入式子系统,从而把语音识别应用到楼宇控制系统中。结合了系统硬件速度快、算法高效的特点,实现了对楼字更加实时、方便的控制。  相似文献   

16.
本文对语音的上升过零间隔从发音机理及统计角度进行了分析,认为语音信号及其差分信号的上升过零间隔较好地体现了不同语音之间的差异性,是一种进行语音识别的理想参数,并利用该参数建立模板,以非线性分块法进行时间对准,以相邻三帧最佳匹配法进行模板匹配,用软件模拟了特定人、小词汇量、孤立词的语音识别,得到了较好的实验结果。  相似文献   

17.
Linear discriminant analysis and kernel vector quantization are integrated into vector quantization based speech recognition system for improving the recognition accuracy of Mandarin digits. These techniques increase the class separability and optimize the clustering procedure. Speaker-dependent (SD) and speaker-independent (SI) experiments are performed to evaluate the performance of the proposed method. The experiment results show that the proposed method is capable of reaching the word error rate of 3.76 % in SD case and 6.60 % in SI case. Such a system can be suitable for being embedded in personal digital assistant(PDA), mobile phone and so on to perform voice controlling such as digit dialing, calculating, etc.  相似文献   

18.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号