期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵力邹采荣吴镇扬《信号处理》2000,16(1):20-23

本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案.通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%. 相似文献

2.

应用矢量量优的孤立词汉语语音识别

张大勇《电讯技术》1989,(6)

本文提出了一种识别孤立词汉语语音的新方法,提取线性预测系数作为语音特征,利用矢量量化的聚类特性压缩数据,用多段码书作为语音样板,用最小失真法进行识别。相似文献

3.

汉语小词汇量表语音识别算法的研究和应用

马丽静李红《电子技术》2012,39(2):13-14,4

论文研究了汉语小词汇表语音识别算法的基本原理,提出了具有鲁棒性的两级端点检测语音识别技术,在语音信号采集时,根据过零率、短时能量对数据进行提取并压缩,采用了多模板匹配算法识别。硬件采用51内核单片机,用较少的存储空间和计算空间实现语音数据处理,不需要额外的器件。实验用20个字的汉语小词汇量系统进行了测试,识别成功率大于90%,显示该算法比通常采用的算法性能更好。相似文献

4.

用反馈式语音识别理解方案进行汉语短语的识别理解

傅秋良袁保宗《电子与信息学报》1998,20(2):194-198

汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。相似文献

5.

用反馈式语音识别理解方案进行汉语短语的识别理解

傅秋良袁保宗《电子科学学刊》1998,20(2):194-198

汉语语音理解系统的任务之一是把语音识别系统获得的汉语单单节转换成正确的汉字，词乃至汉语的短语，语句，与误音识别系统一起，完成一个语音到文本（ｓｐｅｅｃｈｔｏｔｅｘｔ）的转换系统，本文利用一个闭环反馈方式汉语语音识别理解方案，在汉语词识别理解的基础上，进一步实现时汉语结构性短的识别理解，获得了预期的结果，最后本文对实验结果和反馈式语音识别理解方案进行了讨论。相似文献

6.

汉语连续语音识别结果评价算法研究

下载免费PDF全文

刘刚陈伟郭军《中国通信》2010,7(2):132-138

在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也将识别结果评价由四种情况(正确、替代、插入、删除)扩展到六种情况(增加了插入式替代和删除式替代),可以为语音识别的后处理提供更多有用的信息。实验表明,本文所提算法可以有效降低传统评价算法带来的虚假错相似文献

7.

全音节连续汉语语音识别的研究 总被引：3，自引：0，他引：3

傅晓林道发杨家沅《信号处理》1994,(3)

在大词汇量连续汉语语音识别的研究中，我们根据汉语语音自身的特点，选用全音节作为识别单元，与音对文法相结合，以期达到实现大词汇量语音识别的目的．实现连续语音识别时，不需预先切分音节，而使用帧同步型网络搜索算法并在搜索中予以音长控制，用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估，获得了40.40％的音节识别率．相似文献

8.

中文耳语元音的声调特征研究

潘欣裕赵鹤鸣《信号处理》2011,27(10):1525-1530

声带准周期振动的缺失,使得汉语耳语音成为了一种特殊的发音模式,也使得耳语声调无法用基音周期表征。目前用于语音识别和声纹识别的常规语音特征,包含声调信息较少,所以在声调识别实验中很难获得良好的效果。本文提出一种新的特征参数来模拟正常语音的基频声调轨迹,即以人的听觉特性为出发点,研究人的声调敏感Bark频带,发现部分扩散Bark谱能量归一化比例拟合曲线,能够呈现出类似正常语音的基频轨迹,这说明在某些方面该轨迹或多或少包含了耳语音的声调信息。在以该轨迹和语音短时能量曲线为特征,以神经网络为模型的耳语声调识别实验中获得了较高的识别正确率,汉语四声的总体识别正确率高达78%,这也为对耳语音的进一步处理提供了很多有力依据。相似文献

9.

语谱图傅里叶变换的二字汉语词汇语音识别

《现代电子技术》2017,(16):13-18

以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法。首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱图频域图像进行二进宽度分带列投影和行投影,将投影值作为语音识别的第一个特征参数集合和第二个特征参数集合,将以上两个特征集进行特征融合作为二字词汇语音识别的特征量,以支持向量机为分类器实现二字汉语词汇语音识别。实验结果表明,该方法对特定人二字汉语词汇语音的识别率可达96.8%,对非特定人二字汉语词汇语音的识别率可达98.8%,为解决汉语词汇整体语音识别提供了一种新的思路。相似文献

10.

用反馈式语音识别理解方案进行汉语地名的识别理解

傅秋良袁保宗林碧琴《信号处理》1997,(3)

汉语语音理解系统的任务之一是把语音识别系统获得的汉语音节转换成正确的汉字，与汉语语音识别系统一起，完成一个语音-文本（SpeechtoText）的转换系统。本文利用一个有别于语音理解传统方法（1．语言学方法[1]，2．统计学方法[2])的新的反馈式语音理解方案进行汉语地名的识别理解，获得了很好的实验结果。本文最后对实验结果和反馈式语音识别理解方案进行了讨论。相似文献

11.

汉语语音识别研究面临的一些科学问题 总被引：12，自引：0，他引：12

杜利民侯自强《电子学报》1995,23(10):110-116,61

本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题，列举了汉语语音编码的结构特点和规则，强调（１）在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助，也会提供文字语言和讲话语言的有用知识；（２）使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度，减少失配和改善对音位变体的细分，本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径，文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法，用于汉语大词汇连续语音识别。相似文献

12.

汉语普通话的管辖音系学特征及提取方法

刘娇蛟贺前华韦岗《电子学报》2006,34(10):1917-1919

语音识别中多采用音素作为识别单元,因其数量较多,对神经网络训练复杂度的要求高,在多语言语音识别中需要针对不同语言分别建立识别模块.然而,管辖音系学提出了适用于多语言的语音学特征.本文根据英语和汉语发音的相似性,确定汉语普通话声韵母的GP特征表示形式,并应用神经网络实现特征提取.实验表明,GP特征同样可作为汉语语音的语音学特征. 相似文献

13.

基于ANN的汉语数字语音识别

张保轩邵献之《信息技术与信息化》1995,(1)

本文介绍了在语音识别中使用人工神经网络（ＡＮＮ）构成识别系统的新方法，分析了它与传统识别方法的不同及优越性，并以ＢＰ网络构成不定人汉语数字语音识别器，通过计算机模拟实验表明，其识别性能明显优于同样条件下ＨＭＭ识别器，证明了用ＡＮＮ进行语音识别是一种很具吸引力有发展前途的新方法。相似文献

14.

一种改进的线性区分分析方法及其在汉语数码语音识别上的应用 总被引：1，自引：0，他引：1

史媛媛刘加刘润生《电子学报》2002,30(7):959-963

尽管汉语数码语音识别只涉及十个数字,但由于不同数字的发音存在相同或相似的声母或韵母,造成汉语数码语音之间的混淆性很大.采用通常的隐含马尔科夫模型(HMM)作为汉语数码语音识别模型难以得到很高的识别率.为了解决汉语数码之间的混淆问题,提高汉语数码语音识别性能,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法,将不同状态之间容易混淆的特征样本构成混淆模式类,针对混淆模式类进行线性区分分析.通过线性区分变换,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数.这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力.实验表明即使采用状态数很少的粗糙识别模型,也能很大幅度提高模型的识别性能;经过线性区分变换优化后的汉语数码识别模型,孤立汉语数码语音识别率可以达到99.32%. 相似文献

15.

汉语连续语音识别中上下文相关的识别单元(三音子)的研究 总被引：1，自引：0，他引：1

赵庆卫王作英陆大《电子学报》1999,27(6):79-82,117

本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题。相似文献

16.

群延时谱参数在汉语数字语音识别中的应用

下载免费PDF全文

周峰俞一彪《信号处理》2017,33(9):1215-1220

汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果，传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略，先采用MEL谱参数基于HMM进行初级数字语音识别，然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明，通过多参数多级识别方法，数字“2”和“8”的识别率提高了8%，数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能，同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。相似文献

17.

汉语数码语音识别:发展现状、难点分析与方法比较 总被引：9，自引：2，他引：7

顾良刘润生《电路与系统学报》1997,2(4):32-39

本文简述了汉语数码语音识别的发展与现状，分析了汉语数码语音识别的混淆度现象及其它困难，比较了各种实现方法，介绍了作者在实验基础上确定的一些基本参数，指出了若干改进方向。相似文献

18.

汉语语音识别中语言模型的并行优化

金玮孙甲松《电声技术》2010,34(8):49-52

研究了汉语语音识别中语言模型的并行优化问题,在已有汉语语音识别有调拼音模型和多核体系结构的基础上,对其算法进行了并行优化,并优化了查询机制和前后向算法。试验表明,该方法取得了很好的效果,识别速度有了很大改进。相似文献

19.

基于词片的语言模型及在汉语语音检索中的应用

郑铁然韩纪庆李海洋《通信学报》2009,30(3):84-88

在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元--"词片"(word fragment),研究了最佳词片选择算法.汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能. 相似文献

20.

汉语语音识别的抗噪性前端算法及性能分析

林建臻孙甲松王作英《电声技术》2004,(3):45-48,52

讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。相似文献