共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
汉语连续语音识别中不同基元声学模型的复合 总被引:1,自引:0,他引:1
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。 相似文献
3.
汉语语音正弦模型特征分析和听觉辨识 总被引:1,自引:0,他引:1
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主... 相似文献
4.
基于模糊粗神经网络的汉语声韵母切分 总被引:1,自引:1,他引:0
针对汉语连续语音,提出一种声韵母切分方法.根据扩展的声韵母为识别基元.采用汉语音节的重叠音素分割策略,利用模糊粗神经网络进行声韵母自动切分.实验室实验证明了该方法进行音节分割的有效性和合理性. 相似文献
5.
本文通过对汉语语音的特性分析,及各类音素的DFT谱特性,特别是清/浊音的DFT谱差异的研究,概括出了可用于连续语音音节分割的两个相对最佳的动态特征;同时,提出了动态特征曲线极小值区域分布情况的一种定量描述方法——凹谷函数描述法。在这些研究的基础上,本文给出了一个具体的分段算法。实验验证表明,本文的分段方法对连续汉语语音的音节分割是有效的。最后,本文将这种方法应用到语图分析中,并首次实现了连续语音动态语图按音节的自动分割。 相似文献
6.
针对汉语是基于音节的语言,发音过程具有“枣核型”的特点,提出一种描述汉语动态视位的模型,模型分别对音节自身和音节之间的唇部运动进行建模。对音节利用基于声韵母的唇部子运动模型描述,先提取声母和韵母发音时的唇部特征参数,并按参数对口型归类,得到化简的音节视位模型,再计算唇部子运动与音节发音过程在口型上的相似性。在音节间采用元音影响分级的权重函数模拟协同发音影响,先分析各元音与其后接辅音的口型影响,再通过权重函数控制实际发音口型。实验结果表明,相对于单音子或三音子模型表征汉语动态视位,方法提高了动画效率,使得汉语音唇动画更为合理,自然。 相似文献
7.
本文研究了大词汇量非特定人汉语连续语音识别和理解系统中的容错技术.首先,声学识别器产生N个最优(N-best)音节候选及其相应的声学层的概念,再由N个最优音节候选构成一个音节网格(syllable lattice).一个容错语言分析器被用来搜索该音节网格并发现最优的汉字串.由于考虑了额外的可能候选音节,该最优汉字串的某些字的音节可能不在原来的音节网格中.这样,声学层的一些错误被纠正,语言分析器的稳健性(robustness)得以提高.实验表明容错分析器能将字的理解正确率从91.83%提高到94.15%.与传统的无容错技术的基于三元文法模型的分析器相比,错误率下降了28.4%. 相似文献
8.
9.
基于超音段信息在语音感知中的显著作用。本文提出了一种新颖的汉语双音节词(二字词)识别方案。首先将输入语音调型进行时、频归一化处理,并将其和参考调型匹配;再对由此得到的候选集进行精确的谱匹配。在这步处理中结合了动态能量信息,并采用了修正的动态规划算法。实验结果表明,这种方案对于高混淆性汉语二字词识别十分有效。 相似文献
10.
作为汉语语音识别的重要组成部分,声调识别具有关键的作用.提出了一种新的基于前后文相关的模型识别方法用以提高汉语连续语音中的识别率.首先介绍用于声调识别的基因轨迹的提取和处理,然后提出6种特征来描述基因轨迹的变化趋势并给出具体的计算公式,利用这些特征并考虑连续语音中前后音节的相关性对基因轨迹造成的变化而建立细分的声调模型... 相似文献