首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文根据加权倒变距离测度,提出了一种用于非特定人语音识别的函数链神经网络。此网络与多层感知器相比,不仅具有较高的识别别率,而且大大缩短了网络的学习时间。我们采用6人(3男,3女)的语音数据对汉语十个数字进行了实验,正确识别率为93.7%。  相似文献   

2.
文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。  相似文献   

3.
史媛媛  刘加  刘润生 《电子学报》2002,30(7):959-963
尽管汉语数码语音识别只涉及十个数字,但由于不同数字的发音存在相同或相似的声母或韵母,造成汉语数码语音之间的混淆性很大.采用通常的隐含马尔科夫模型(HMM)作为汉语数码语音识别模型难以得到很高的识别率.为了解决汉语数码之间的混淆问题,提高汉语数码语音识别性能,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法,将不同状态之间容易混淆的特征样本构成混淆模式类,针对混淆模式类进行线性区分分析.通过线性区分变换,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数.这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力.实验表明即使采用状态数很少的粗糙识别模型,也能很大幅度提高模型的识别性能;经过线性区分变换优化后的汉语数码识别模型,孤立汉语数码语音识别率可以达到99.32%.  相似文献   

4.
孙卓  岳振军 《电声技术》2007,31(6):37-40
汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。  相似文献   

5.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。  相似文献   

6.
周峰  俞一彪 《信号处理》2017,33(9):1215-1220
汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字“2”和“8”的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。   相似文献   

7.
文本相关重点研究的说话人语音识别是语音识别研究中的一个重要分支。本论文介绍了一种采用特征空间轨迹匹配方式的基于数字语音的身份识别系统的设计方法。并针对"0"到"9"这十个数字,对不同说话人的语音特征的可区分性进行了探讨,提出了数字区分度算法,以便找出最能有效区分不同说话人的数字,进而在识别系统中提高识别效率。实验结果表明,本论文提出的数字区分度算法在小规模语音说话人集合中得到了验证。  相似文献   

8.
汉语语音基音轨迹的形态学滤波和平滑   总被引:9,自引:0,他引:9  
赵晓群  王光艳 《信号处理》2003,19(4):354-357
本文依据数字语音信号的特点,设计了一种用于语音处理的形态学滤波算法,合理选择结构元素构筑了一组用于汉语语音基音轨迹平滑的形态学滤波器,仿真数据的实验结果表明这种方法对于随机误判点与传统中值组合平滑相比效果更佳,同时也证明了数学形态学用于语音信号研究的可行性。  相似文献   

9.
描述了用于铁路客运服务的BJD-I汉语理解系统。其中,采用了最大共振峰准连续语音区段检测、音节分割算法MFDS和快速动态规划匹配算法FSDP的语音处理部分,使准连续语音音节分割的正确率达到98%以上,匹配速度也比Sako的最佳动态规划法快一倍以上。还在语言处理部分建立了句法分析用文法RSNG和层次知识表达法。以一名男性说话人做的实验表明,BJD-I汉语理解系统的语义项识别率为80%,服务完成率为98%。  相似文献   

10.
数字信号处理(DSP)技术的迅速发展,为语音实识别的实时实现提供了可能.本文尝试采用TI公司新型号的DSP芯片,建立一个汉语数字的语音实时识别系统,实验蛄果表明,该系统基本能实现预期识别目标.  相似文献   

11.
赵越  林玮 《电声技术》2016,40(11):48-52
耳语音的声学特征是研究其语音识别和说话人识别的重要组成部分.介绍了耳语音的特点并讨论了其声学特征.由于耳语音没有基频,所以共振峰与音长特性可以作为重要的声学参数用于识别.对汉语6个耳语音元音进行了分析研究,证明共振峰频率和音长可以作为耳语音识别的特征参数.  相似文献   

12.
汉语语音的识别,一定要结合汉语的特点。本文介绍了一种用汉语辅音音长信息加速语音模式匹配和用起终点过渡音识别语音的方法。实验表明:该系统响应迅速,已达到了98%(平均)的正确识别率。  相似文献   

13.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

14.
本文对神经网络法语音识别中的网络结构、特征提取以及学习算法进行了初步的研究.文中提出了一种带非均匀窗形式的金字塔状多层神经网络模型I研究了两种特征提取方法的向量规整问题,改进了Polak—Rjbiere学习算法并证明它能够保证连结权向量不收敛到非稳定局部极小点.特定人方式的试验表明,用神经网络方法识别五个元音和十个数字时,识别率都高于99.0%.用遍布25个省市的90个说话者的数字话音所进行的非特定人方式试验表明;加窗后识别率可以提高1.0%,达到90.3%,说明带预处理窗的模型更加适合于语音识别.  相似文献   

15.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法.  相似文献   

16.
因与原始语音具有高度相似性,经高保真设备回放的翻录语音常被不法分子用于对说话人认证(ASV)系统进行攻击,以达到非法认证的目的.为提高系统抵抗翻录语音攻击的顽健性,通过研究原始语音与翻录语音产生的实际过程,发现两者在频率域相位上有明显差异,并在此基础上提出了一种基于相位谱的翻录语音检测方法.分析讨论了FFT和不同偷录、回放设备对翻录语音检测率的影响.实验结果表明,该方法能够准确地判断待测语音是否为翻录语音,其检测率达到了99.04%.并且,将该算法加载到说话人识别系统中,使系统的等错误概率(EER)降低了约22%,有效提高了系统抵抗翻录语音攻击的性能.  相似文献   

17.
因为计算机用起来相当方便,所以,用语音进行人一机通信开始普及。把语音用作计算机输出的信息,有以下几个优点。 (1)人容易理解; (2)用电话同广播设备连接,可将信息传到远方; (3)可唤起听者注意。最初,计算机语音输出采用模拟录音等方式,装置规模很大。近年来,随着数字语音处理技术和半导体技术的发展,可以使设备小型化,价格也降低。这样,在个人计算机和工作站等也能很方便地采用语音输出方式。语音合成在多方面获得了广泛应用。  相似文献   

18.
本文介绍称为脉冲串(pulseTrain)的数字调整器,它具有无条件的稳定性,在低负荷下,电源控制器获得了高的性能,包括80%到89%的高效率和低功耗、低纹波。这是传统和模拟的电源变换器无法达到的。它们不仅可用于普通电子设备,更可用于手持式移动电子设备,如PDA、数字照相机等。 一、数字电源控制器的基本原理与特性 传统的模拟和PWM(脉宽调制)电源变换控制器为电源设计者的需求足足服务了几十年。虽然,近来它们似乎已逼近到了一堵“积木”墙,几乎无路可走了。为了在转换效  相似文献   

19.
本文以广播电台的连续型标准汉语普通话语音为研究对象,对30人次(15个男性和15个女性)的普通话语音、15人次的男性普通话以及15人次的女性普通话语音分别在两种门限下进行了talkspuns-pauses模型的统计分析,找出了talkspurts和pauses长度的统计概率分布规律和一些相应的统计特征值。本文还附带对27人次(17个男性和10个女性)的广州话语音在相同的条件下进行了类似的统计分析,得出了相应的统计结果。  相似文献   

20.
研究了一种汉语数字语音识别方案,首先提取汉语数字语音线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)及其一阶差分,并组合成新特征。通过求取其系数矩阵的均值和方差的方式进行一次降维,然后采用基于关联规则的特征选择算法进行二次降维,并采用C4.5决策树算法进行识别。通过实验表明本文提出的方法能够有效降低特征维度,去除了无用的冗余信息,提高了语音识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号