首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
刘娇蛟  贺前华  韦岗 《电子学报》2006,34(10):1917-1919
语音识别中多采用音素作为识别单元,因其数量较多,对神经网络训练复杂度的要求高,在多语言语音识别中需要针对不同语言分别建立识别模块.然而,管辖音系学提出了适用于多语言的语音学特征.本文根据英语和汉语发音的相似性,确定汉语普通话声韵母的GP特征表示形式,并应用神经网络实现特征提取.实验表明,GP特征同样可作为汉语语音的语音学特征.  相似文献   

2.
赵晖  唐朝京 《电子与信息学报》2009,31(12):3010-3014
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出视频三音素的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较高。  相似文献   

3.
汉语连续语音识别中不同基元声学模型的复合   总被引:1,自引:0,他引:1  
张辉  杜利民 《电子与信息学报》2006,28(11):2045-2049
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。  相似文献   

4.
本文通过对汉语语音的特性分析,及各类音素的DFT谱特性,特别是清/浊音的DFT谱差异的研究,概括出了可用于连续语音音节分割的两个相对最佳的动态特征;同时,提出了动态特征曲线极小值区域分布情况的一种定量描述方法——凹谷函数描述法。在这些研究的基础上,本文给出了一个具体的分段算法。实验验证表明,本文的分段方法对连续汉语语音的音节分割是有效的。最后,本文将这种方法应用到语图分析中,并首次实现了连续语音动态语图按音节的自动分割。  相似文献   

5.
汉语单音节清晰度与STI-PA关系的实验测量   总被引:1,自引:1,他引:0  
在实验室条件下对无噪声纯混响作用下STI—PA与汉语普通话单音节清晰度之间的关系进行了实验研究,归纳出了STI—PA与普通话单音节清晰度之间的函数关系。实验结果表明,汉语普通话单音节清晰度受混响的影响与基于外语的研究结果有所不同。  相似文献   

6.
本文通过电磁发音仪(Electro Magnetic Articulography,EMA)AG500,以200帧/秒的采样率采集了英语和汉语的标准发音动作数据,然而,交叉语言比较的首要任务就是要消除特定说话人声道特性及其它个人生理特性等音素而引起的固有差别,本文采用了基于说话人归一化的普氏算法来进行说话人归一化处理,获得了英汉相似音素发音的元音对比最小对,最后成功揭示了2种语言易混淆元音发音文本对在口腔内外发音动作上的区别.  相似文献   

7.
用1/3音节作匹配基元研究汉语单字音识别[Ⅰ]   总被引:1,自引:0,他引:1  
本文通过对汉语语音特点的分析,结合数字信号处理的有关理论,提出了用1/3音节作匹配基元进行汉语单字音识别的方法。它是按汉语音节结构将单字音分成三个匹配基元进行识别的,然后再把结果相拼组成单字音。这种方法介于音素识别和音节识别之间。小字库(104个音节)实验表明:该方法基本上保持了音素识别法的运算量,存贮量低的优点:同时也保持了音节识别法的识别率较高的优势,是一种值得探索的方法。本文主要介绍该方法的原理及韵母识别部分的实验结果。  相似文献   

8.
汉语普通话是一种带声调的语言,声调信息在汉语连续语音识别中具有非常重要的作用。传统的连续语音声调识别算法一般只研究阴平、阳平、上声、去声的声调特征,却很少讨论第零声(即轻声)的声调特征。利用归一化自相关函数法研究了轻声音节基频轨迹的特点,并给出了可用于识别轻声音节的一些基本声调特征。  相似文献   

9.
基于3维空间Viterbi算法的汉语连续语音识别方法   总被引:1,自引:0,他引:1       下载免费PDF全文
赵力  邹采荣  吴镇扬 《电子学报》2000,28(7):67-69,58
本文提出了基于3维空间Viterbi算法的汉语连续语音识别方法。本方法采用60个音素单位的隐马尔可大模型(HMM)和8个声调单位的HMM作为识别用基元模型。音素基元模型和声调基元模型的识别结果的统合,采用音素单位的HMM状态,声调单位的HMM状态和时间的3维空间Viterbi算法来实现。  相似文献   

10.
汉语普通话属于声调语言。在汉语音节当中,即便声韵相同,如若声调不同,从口腔传递出的声束其含义也会大不相同,而声调是否精准是评定一个人普通话是否标准的重要方式之一。播音员主持人与普通人相比可以熟练地掌握声调四个调类准确性,但往往在声调的调值上无法精准把握,而熟练准确地掌握普通话声调调值,对于播音员主持人说出标准规范的普通话至关重要。  相似文献   

11.
董桂官  刘云  徐楠 《电声技术》2014,38(11):57-59
在目前中文语音识别的研究与应用基础上,提出了针对智能电视产品的语音识别测试方案。该测试方案基本覆盖了智能电视这一产品类型语音识别功能与性能的主要测试指标,测试结果的分析反映了目前智能电视语音识别应用的技术现状;测试过程与结果也验证了该方案的实用性和有效性。  相似文献   

12.
李伟  李媛媛 《电声技术》2011,35(7):42-44
针对目前汉语连续语音识别中英文识别问题,采用中英文混合建模的方法建立中英文混合模型.在分析已有语音识别系统的基础上,根据发音学的一些先验知识,提出一种基于主元音及英文音素序列混合的声学模型,同时利用最大似然规则训练出的声学模型,通过最小音素错误准则对声学模型进行区分性训练,更新得到最终的声学模型.在测试集上的结果表明,...  相似文献   

13.
该文提出了一种在实际环境下利用DSP实现的语音识别方案,通过户外实际环境的语音识别实验,这种方法的有效性得到了验证。  相似文献   

14.
对语音口型匹配的机理进行了概要探析.首先归结了语音口型运动遵循的一些规则,然后在此基础上,结合汉语语音发音特点,从几何形状匹配和时间匹配两个层面,探析了语音与口型匹配的机理.在几何匹配层面,阐述了汉语语音与口型的对应方法,并进一步分析了声母和韵母口型的形成机理;在时间匹配层面,简要分析了声母和韵母口型的时间对位方法.  相似文献   

15.
汉语语音识别研究面临的一些科学问题   总被引:12,自引:0,他引:12  
杜利民  侯自强 《电子学报》1995,23(10):110-116,61
本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题,列举了汉语语音编码的结构特点和规则,强调(1)在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助,也会提供文字语言和讲话语言的有用知识;(2)使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度,减少失配和改善对音位变体的细分,本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径,文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法,用于汉语大词汇连续语音识别。  相似文献   

16.
汉语语音播放是许多嵌入式系统的重要功能,语音库的制作又是实现这一功能的重要基础.阐述了制作SPCE061A压缩格式GB2312汉字语音库的方法.此方法分生成语音库文件及汉字读音序号索引表、裁剪语音库文件、压缩语音库文件等几个步骤.  相似文献   

17.
汉语耳语音转换为正常音的研究   总被引:1,自引:0,他引:1  
樊星  卢晶  徐柏龄 《电声技术》2005,(12):44-47
耳语音转换为正常音,可应用于公共场所的通信、失语者的语音恢复和司法工作的某些特殊需要等方面。由于耳语发音和正常音在激励源和声道传递函数上存在差异,所以一般的语音合成方法不再适用。分析了耳语音的发音及声学特点,初步建立了一个基于同态信号处理方法并结合相对熵声韵分割的耳语音重建系统,入耳对恢复出的正常音可以正确分辨。  相似文献   

18.
高脉冲噪声坏境中双门限法语音端点检测研究   总被引:1,自引:0,他引:1  
刘超  庄圣贤 《电子科技》2013,26(4):116-118,123
语音端点检测是对有效语音段的识别关键技术,准确的端点检测使语音信号的后续处理计算量减少,有效地节约资源。现在多数语音端点检测技术例如能频值、谱熵、小波能量熵变换等都能准确检测出有效的语音段。文中介绍了一种双门限端点检测法,即利用短时平均过零率和短时平均能量法进行双门限检测,再设置一个最短时间门限,有效地在高脉冲噪声环境中准确识别汉语发音。通过与其他方法对比实验,文中双门限技术在短时高脉冲噪声环境下能有效提高语音识别率。仿真结果表明,端点检测正确率达93%。  相似文献   

19.
汉语语音正弦模型特征分析和听觉辨识   总被引:1,自引:0,他引:1  
张毅楠  肖熙 《电声技术》2011,35(8):38-41
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主...  相似文献   

20.
可懂度是评价语言传递信息能力的重要指标.通过主观实验的方法,对白噪声、粉红噪声、Babble噪声以及时间反转信号四种干扰信号和三种单通道语音增强算法在低信噪比(-15~0 dB)条件下对汉语可懂度的影响进行了测试和评价.结果表明,四种干扰信号的干扰效果差异明显;单通道语音增强算法不能显著提高汉语可懂度;测试语料选择对汉语可懂度的影响很大;时频域二值掩蔽算法对时间反转信号干扰下在维持和提高汉语可懂度方面存在优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号