共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
汉语语音合成系统中激励源和声调模型研究 总被引:1,自引:0,他引:1
在语音合成器中激励源对合成语音的质量有极为重要的作用,本文对几种浊音激励源及其合成的结果进行了分析比较,同时对激励源细动态变化特性进行了研究。汉语的声调对合成语音质量影响很大,本文通过对语音基频、音长、音强的变化分析研究,建立了汉语的声调模型。在此基础上开发了一种并联型共振峰模型,该合成器能合成出具有较好清晰度和自然度的语音 相似文献
3.
本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。 相似文献
4.
作为汉语语音识别的重要组成部分,声调识别具有关键的作用.提出了一种新的基于前后文相关的模型识别方法用以提高汉语连续语音中的识别率.首先介绍用于声调识别的基因轨迹的提取和处理,然后提出6种特征来描述基因轨迹的变化趋势并给出具体的计算公式,利用这些特征并考虑连续语音中前后音节的相关性对基因轨迹造成的变化而建立细分的声调模型... 相似文献
5.
汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。 相似文献
6.
森德通讯公司(centigram Communications corporation)是美国一家专门设计、制造和销售语音信息处理系统的专业公司。它是世界上首家推出了集数据、话音与图象于一体的信息处理系统——Series 6.0超级信息处理平台的公司,并拥有多项语音处理技术专利。 相似文献
7.
汉语语音识别研究面临的一些科学问题 总被引:12,自引:0,他引:12
本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题,列举了汉语语音编码的结构特点和规则,强调(1)在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助,也会提供文字语言和讲话语言的有用知识;(2)使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度,减少失配和改善对音位变体的细分,本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径,文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法,用于汉语大词汇连续语音识别。 相似文献
8.
一种改进的线性区分分析方法及其在汉语数码语音识别上的应用 总被引:1,自引:0,他引:1
尽管汉语数码语音识别只涉及十个数字,但由于不同数字的发音存在相同或相似的声母或韵母,造成汉语数码语音之间的混淆性很大.采用通常的隐含马尔科夫模型(HMM)作为汉语数码语音识别模型难以得到很高的识别率.为了解决汉语数码之间的混淆问题,提高汉语数码语音识别性能,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法,将不同状态之间容易混淆的特征样本构成混淆模式类,针对混淆模式类进行线性区分分析.通过线性区分变换,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数.这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力.实验表明即使采用状态数很少的粗糙识别模型,也能很大幅度提高模型的识别性能;经过线性区分变换优化后的汉语数码识别模型,孤立汉语数码语音识别率可以达到99.32%. 相似文献
9.
汉语语音正弦模型特征分析和听觉辨识 总被引:1,自引:0,他引:1
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主... 相似文献
10.
11.
研究了汉语语音识别中语言模型的并行优化问题,在已有汉语语音识别有调拼音模型和多核体系结构的基础上,对其算法进行了并行优化,并优化了查询机制和前后向算法。试验表明,该方法取得了很好的效果,识别速度有了很大改进。 相似文献
12.
13.
14.
在现代通信系统与信息处理系统中,低速率语音编码、语音合成与识别技术正在获得大量的应用。本文综述了近年来国外在语音编码、合成和识别技术领域里所取得的新进展及其发展趋向。 相似文献
15.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
16.
本文提出了一种新的汉语语音模型-多组状态转移顺序聚类模型(MSSC).该模型采用了马尔可夫过程的状态转移方式,描述汉语语音的特征矢量序列的时序过程,同时采用了动态时间匹配DTW的比对概念和直接特征状态而不是HMM法的隐状态.新的模型具有多组子模型特点,从而对语音速度的变化,语音轻重的变化等有较强的适应能力.在描述状态转移方面,增加了记录各状态的自转移次数,用其作权重可更好地利用特征信息,提高识别率.另外,该方法的物理意义明显,故可以根据不同的特征矢量,进行合理的加权评判,且可以方便地扩充特征矢量的种类,更好的利用了汉语语音中的有用信息,进一步提高识别的正确率.本文从原理上及实际的测算结果证实了新方法的有效性. 相似文献
17.
针对目前汉语连续语音识别中英文识别问题,采用中英文混合建模的方法建立中英文混合模型.在分析已有语音识别系统的基础上,根据发音学的一些先验知识,提出一种基于主元音及英文音素序列混合的声学模型,同时利用最大似然规则训练出的声学模型,通过最小音素错误准则对声学模型进行区分性训练,更新得到最终的声学模型.在测试集上的结果表明,... 相似文献
18.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。 相似文献
19.