首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语音拒识技术是实现一个实用语音识别系统的关键。提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音。在一个非特定人英语命令词识别系统中做了一些相关的实验来评估这个算法的性能。实验结果表明,该算法可以有效地去除识别不可靠的语音,提高语音识别的整体性能。  相似文献   

2.
论文旨在研究基于MATLAB平台的特定人孤立词小词汇量的语音识别系统的实现。文章分别对语音信号的预处理过程、语音信号的特征提取及语音信号的识别算法等方面进行深入研究和分析在端点检测过程中,使用短时能量和过零率双门限进行检测,应用识别率较高的MFCC作为特征参数,针对传统DTW算法在语音识别中测试语音与参考语音模板匹配所需时间较长的问题,提出搜索路径改进算法,使得算法的运算速度有所提升。为了提升DTW的识别率,提出改进的模板匹配方法——多模板匹配方法。实验结果证明,采用改进算法的语音识别系统有效地降低了识别时间,提高了系统的识别率。  相似文献   

3.
蔡铁  朱杰 《计算机工程》2005,31(10):22-24
在自动语音识别系统的实际应用中,词表外(Out-of-Vocabulary,OOV)语音的检测与拒识非常重要,针对语音识别的实时性要求,提出了一种新的基于支持向量机的OOV快速拒识算法,并将其应用于基于DSP实现的孤立词语音识别系统中,实验结果表明,该算法计算简单,实时性好,且效果显著,拒识率达80%以上。通过与传统神经网络方法的比较,证明该算法具有更好的性能和应用潜力。  相似文献   

4.
嵌入式实时英语语音识别系统的设计和实现   总被引:2,自引:0,他引:2  
采用两级识别网络,以连续隐含马尔可夫模型为基本识别框架,基于一个100MIPS的16位定点DSP语音芯片平台,实现了嵌入式非特定人、中等词汇量英语孤立词实时识别系统。  相似文献   

5.
语音识别片上系统可以实现简单的人机交互和语音控制,在家电、玩具及各种人机交互系统中有着广泛的应用前景.本文结合汉语语音特点,在TMS320VC5507芯片上实现了高性能特定人与非特定人中小词汇量孤立词识别系统.采用基于循环缓冲区的端点检测算法,双缓冲区的传输方式用于语音录制和回放,分别采用降低特征维数的DTW算法和基于连续隐含马尔可夫模型(CDHMM)的多级搜索算法作为核心识别算法,并给出实验结果.  相似文献   

6.
语音识别中统计与规则结合的语言模型   总被引:2,自引:1,他引:1  
王轩  王晓龙  张凯 《自动化学报》1999,25(3):309-315
在分析语音识别系统中,基于规则方法和统计方法的语言模型,提出了一种对规则 进行量化的合成语言模型.该模型既避免了规则方法无法适应大规模真实文本处理的缺点, 同时也提高了统计模型处理远距离约束关系和语言递归现象的能力.合成语言模型使涵盖6 万词条的非特定人孤立词的语音识别系统的准确率比单独使用词的TRIGRAM模型提高了 4.9%(男声)和3.5%(女声).  相似文献   

7.
本文建立了一个孤立词语音识别系统,并利用MATLAB的语音工具箱voice box对系统进行了仿真和分析。实验结果表明,对20个孤立词的非特定人识别,准确率在95%左右。  相似文献   

8.
从理论及实验两个方面出发,以短时自关函数作为语音特征的特定人、孤立词、中小词汇量的汉语语音识别系统,计算方法简单,硬件处理容易,且具有较高的识别率。在语音信号处理中,常用短时自关函数进行短时基音周期估计,作为语音特征应用于语音识别中系率先进入该领域的应用,其首选正确识别率达99%  相似文献   

9.
介绍了基于连续隐含马尔可夫模型(CHMM)的非特定人孤立词语音识别系统.根据分析该系统计算复杂度,提出了一系列的优化方法,通过MATLAB平台下的研究实验数据表明,优化后的语音识别系统与传统CHMM语音识别系统对比,计算时间是传统CHMM系统的9.97%,而识别率仅从传统CHMM系统的94%下降到91.3%.  相似文献   

10.
小词汇量非特定人语音识别在嵌入式系统中的应用   总被引:5,自引:0,他引:5  
刘振安  孙捷  王晋军 《计算机工程》2006,32(11):213-215
给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可大模型方法实现语音识别系统。该系统适应性强,可扩展性好,具有一定的实时性和语言无关性。当在算法上针对汉语普通话进行优化后,则能进一步提高识别汉语的准确性和实时性。  相似文献   

11.
12.
13.
This paper investigates a data-driven word decompounding algorithm for use in automatic speech recognition. An existing algorithm, called “Morfessor,” has been enhanced in order to address the problem of increased phonetic confusability arising from word decompounding by incorporating phonetic properties and some constraints on recognition units derived from forced alignments experiments. Speech recognition experiments have been carried out on a broadcast news task for the Amharic language to validate the approach. The out of vocabulary (OOV) word rates were reduced by 35% to 50% and a small reduction in word error rate (WER) has been achieved. The algorithm is relatively language independent and requires minimal adaptation to be applied to other languages.   相似文献   

14.
Many people with disabilities do not have the dexterity necessary to control a joystick on an electric wheelchair. Moreover, they have difficulty to avoid obstacles. The aim of this work is to implement a multi-modal system to control the movement of an Electric wheelchair using small vocabulary word recognition system and a set of sensors to detect and avoid obstacles. The methodology adopted is based on grouping a microcontroller with a speech recognition development kit for isolated word from a dependent speaker and a set of sensors. In order to gain in time design, tests have shown that it would be better to choose a speech recognition kit and to adapt it to the application. The text was submitted by the authors in English.  相似文献   

15.
The problem of improving the accuracy of small vocabulary isolated word speaker dependent speech recognition under adverse conditions such as factory environments is considered. A new approach to solving this problem, by using Output Probability Distributions (OPDs), is presented. OPDs improve the system performance by modelling inter-word relationships, something that a standard maximum likelihood (ML) technique fails to do. The system was tested using the TI46 database, corrupted with the NOISEX-92 database, as well as in a real-world factory environment, and achieved good results.  相似文献   

16.
鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现.应用该算法进行电话语音库的文本转写,构建了维吾尔语的电话语音库.实验结果表明,该控制测试集OOV的方法能够有效地提高维吾尔语语音识别率.  相似文献   

17.
汉语语音检索的集外词问题与两阶段检索方法   总被引:2,自引:0,他引:2  
该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于集内查询词,将此问题定义为汉语语音检索任务的集外词问题,并提出两阶段的检索方法,第一阶段通过模糊音素匹配的方法提高查全率,第二阶段通过词格修正的方法提高查准率。实验表明,两阶段的检索方法极大的提高了典型集外查询词的检索性能,FOM指标相对基线系统提高了24.1%。  相似文献   

18.
刘春丽  李晓戈  刘睿  范贤  杜丽萍 《计算机应用》2016,36(10):2794-2798
为提高中文分词的准确率和未登录词(OOV)识别率,提出了一种基于字表示学习方法的中文分词系统。首先使用Skip-gram模型将文本中的词映射为高维向量空间中的向量;其次用K-means聚类算法将词向量聚类,并将聚类结果作为条件随机场(CRF)模型的特征进行训练;最后基于该语言模型进行分词和未登录词识别。对词向量的维数、聚类数及不同聚类算法对分词的影响进行了分析。基于第四届自然语言处理与中文计算会议(NLPCC2015)提供的微博评测语料进行测试,实验结果表明,在未利用外部知识的条件下,分词的F值和OOV识别率分别达到95.67%和94.78%,证明了将字的聚类特征加入到条件随机场模型中能有效提高中文短文本的分词性能。  相似文献   

19.
用于拟人机器人的嵌入式语音交互系统研究   总被引:3,自引:0,他引:3  
陈斌  郭大勇  施克仁 《机器人》2003,25(5):452-455
本文介绍了一种用于拟人机器人的嵌入式语音交互系统.系统采用高质量的语音 采集模块及语音输出模块,以高性能数字信号处理器(DSP)TMS320VC5402为硬件核心.HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练.同时进行了语音特征不同表达形式对识别结果影响的对比实验.系统外围控制程序完成识别结果提示以及与上位机的通讯.系统在词汇量为200的非特定人、孤立词识别上取得了很好的效果.  相似文献   

20.
This paper describes various speaker normalization and adaptation techniques of a knowledge data base or reference templates to new speakers in automatic speech recognition (ASR). It focuses on a technique for learning spectral transformations, based on a statistical-analysis tool (canonical correlation analysis), to adapt a standard dictionary to arbitrary speakers. The proposed method should permit to improve speaker independence in large vocabulary ASR. Application to an isolated word recognizer improved a 70% correct score to 87%.A dynamic aspect of the speaker adaptation procedure is introduced and evaluated in a particular strategy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号