首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
全刚  肖熙 《电声技术》2010,34(6):45-47
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。  相似文献   

2.
本文对神经网络法语音识别中的网络结构、特征提取以及学习算法进行了初步的研究.文中提出了一种带非均匀窗形式的金字塔状多层神经网络模型I研究了两种特征提取方法的向量规整问题,改进了Polak—Rjbiere学习算法并证明它能够保证连结权向量不收敛到非稳定局部极小点.特定人方式的试验表明,用神经网络方法识别五个元音和十个数字时,识别率都高于99.0%.用遍布25个省市的90个说话者的数字话音所进行的非特定人方式试验表明;加窗后识别率可以提高1.0%,达到90.3%,说明带预处理窗的模型更加适合于语音识别.  相似文献   

3.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

4.
语音识别是人机交互的一种重要技术手段。根据实际需要和应用场合的不同,语音识别可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别。语音识别追求的主要指标为高识别率、实时性和大词汇量.  相似文献   

5.
介绍了一种基于连续M元高斯混合密度的隐马尔可夫模型(HMM)的非特定人孤立词语音识别仿真系统。通过研究模型状态数、训练时间以及特征参数选取对语音识别率的影响,得出HMM状态数取4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90%。  相似文献   

6.
王维强 《电子设计工程》2012,20(12):186-189
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。  相似文献   

7.
本文从模板匹配的角度研究了多层前向感知机(MLP)在汉语孤立数目字语音识别中的应用,针对训练样本数受限的情况提出了新的训练方法,研究了语音固化、特征提取、学习算法和策略诸方面问题。对特定人和非特定人汉语孤立数目字语音识别分别达至了95.7%和93.0%(无拒识)的识别率。  相似文献   

8.
以Xilinx公司Virtex-II Pro为开发平台,实现了一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的孤立词语音识别系统.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数.实验表明系统在150词条的情况下识别率达到97.3%,识别时间为1.42倍实时.  相似文献   

9.
基于音素的非特定人英语命令词识别算法研究   总被引:2,自引:0,他引:2  
贲俊  余小清  万旺根 《信号处理》2002,18(6):535-538
本文提出了一种新的基于音素的非特定人英语命令词识别算法,并在此算法基础上构建了一个非特定人英语命令词识别系统。结合非特定人语音识别系统的特点,系统的实现采用了HTK与VisualC++两种工具混和使用,提高了整个系统的开发效率。在识别阶段将置信度评估和不完全匹配的方法结合在一起,在一定程度上提高了识别的质量,在词汇量大于10的情况下取得了87.8%的识别率。  相似文献   

10.
张晨燕  孙成立 《电信科学》2006,22(10):60-63
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时.  相似文献   

11.
周利清 《数字通信》1999,26(3):6-7,10
介绍一个抗噪声,脱离计算机的实时话音识别系统,由于该系统具有使用者自行训练功能,因此能够在不认人的情况下达到很高的识别率,该系统采用了先进的智能算法,并以高速数字信号处理器(DSP)为核心部件研制而成,不但可以用于电话机进行话音拨号,还可用于其它设备作为声控装置投入实际应用。  相似文献   

12.
Chatelain  P. 《Electronics letters》1998,34(15):1472-1473
An automatic speaker verification system is investigated as a means of reinforcing speech recognition security. The system's implementation is independent of speaker population size. Given clean speech and a five digit code, 91.3% of impostor attempts at breaching security are thwarted. The corresponding figure for coded speech is 88.2%  相似文献   

13.
循环相关匹配滤波器设计   总被引:10,自引:0,他引:10  
李虎生  刘加  刘润生 《电子学报》2003,31(1):103-108
在谱相关分析的基础上,讨论了对循环平稳信号进行最佳滤波的问题,推导得到了基于最大输出信噪比准则的循环相关匹配滤波器的解析表式.然而,由于该滤波器性能与所选取的循环频率是相关的,单循环频率循环相关匹配滤波器存在固有的缺陷-信号能量利用不充分.为此,研究了多循环频率循环相关匹配滤波器组的设计方法,在最大输出信噪比准则约束下确定了滤波器组的优化结构.仿真实验比较了谱相关分析方法和循环相关匹配滤波方法,对调幅信号和BPSK信号的仿真实验结果证实了文章理论分析得到的结果.  相似文献   

14.
在非特定人孤立词语音识别系统中,模板库的容量成为限制识别范围和性能的重要原因,过大的模板库在成本和实时性方面都不利于语音识别系统的大规模使用。提出了一种用于大幅压缩语音识别模板库容量的方法,适用于非特定人孤立词识别系统。该算法借鉴生态学上各物种对专一环境和普通环境的适应程度上的折衷,通过类似不同生物间争夺食物的演化过程选出最具代表性的模板组成模板库。模拟结果表明,该算法通过去除近似雷同的模板以及在某些情况下用一个大模板取代数个模板,能在不显著影响识别率的前提下,明显减少所需模板库的容量。  相似文献   

15.
汉语数码语音识别自适应算法   总被引:4,自引:0,他引:4  
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的方法以及自适应对非自适应人的影响。实验表明,MAP算法可以有效地降低汉语数码识别对被适应人的误识率,而且对非自适应人性能影响很小。  相似文献   

16.
The evaluation of the degree of speech impairment and the utility of computer recognition of impaired speech are separately and independently performed. Particular attention is paid to the question concerning whether or not there is a relationship between naive listeners' subjective judgments of impaired speech and the performance of a laboratory version of a speech recognition system. It is a difficult task to relate a speech impairment rating with speech recognition accuracy. Towards this end, a statistical causal model is proposed. This model is very appealing in its structure to support inference, and thus can be applied to perform various assessments such as the success of automatic recognition of dysarthric speech. The application of this model is illustrated with a case study of a dysarthric speaker compared against a normal speaker serving as a control  相似文献   

17.
高性能汉语数码串语音识别   总被引:9,自引:0,他引:9       下载免费PDF全文
李虎生  刘加  刘润生 《电子学报》2001,29(5):595-599
本文给出了一个高性能汉语数码串非特定人连续语音识别系统,其声学模型基于Mel倒谱系数和连续HMM,识别时采用多候选帧同步搜索算法,并采用了MCE算法进行训练以提高系统的区分能力,实验证明该系统的识别率为94.8%(不定长数字串)和96.8%(定长数字串).为增强系统的实用性,本文还研究了基于MAP算法的说话人自适应算法和基于置信度的拒识算法.在进行自适应后,误识率可相对下降40%以上,在拒绝掉5%的正确语音时,系统识别率可以上升到96.9%(不定长数字串)和98.7%(定长数字串).  相似文献   

18.
基于谱减的Robust电话语音识别方法   总被引:1,自引:0,他引:1  
谱减技术是语音增强的有效方法,并被成功地应用到了车辆等环境下的Robust语音识别中。文章对将谱减技术应用到电话语音识别中的加性噪声去除上进行了尝试。实验验证该方法有利于改进电话语音识别的性能,对不特定话音84个孤立词的实验,误识率下降了21.8%。  相似文献   

19.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号