期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王永生《计算机应用》2008,28(Z1)

提出了一种基于迭代的有限状态转录机的字素音素转换学习语料库的自动生成算法,针对一个德语单词及其音标进行基于形态规则和语音规则的迭代,最终将字素和音素完全一一对应起来。经过抽样测试,算法的正确率可以达到98.6%。相似文献

2.

英语语音合成中基于DFGA的字音转换算法 总被引：1，自引：1，他引：0

王永生柴佩琪宣国荣《计算机工程与应用》2006,42(13):158-161,190

在英语语音合成中,由于英语有着几乎无限多的词汇,我们不可能创建包含所有词汇的词库。因而对于未包含在词库中的英语单词,通过“字素转换成音素(G2P)”算法自动生成其音标是一个最好的解决办法。为此,论文提出了一种动态有限泛化法(DFGA)的机器学习算法,用于进行字素/音素转换规则的学习。用于学习的词典库有27040个单词,其中90%的词用于规则学习,剩下的10%用于测试。经过10轮交叉验证,学习集和测试集的平均字素转换正确率为99.78%和93.14%,平均单词转换正确率为99.56%和73.51%。相似文献

3.

基于HMM算法的英语形音匹配可视分析

段青青《计算机应用与软件》2021,38(8):44-50,57

形音匹配是指字素与音素相互转换的过程,它是语音识别、语音合成的基础.许多研究学者采用深度学习模型来提高形音匹配的准确率,但所得到的匹配模式比较复杂,不利于人的学习.针对上述问题,提出一种基于HMM的时序与模式可视分析方法,用于分析窗口大小与方向对字素发音的影响,以获取得到高频发音模式.将模式与机器学习方法相结合以更好地揭示形音匹配的隐藏规律,且对不同字素的影响模式进行比较分析.该方法可以有效提高学习者对单词的解码能力和拼写能力. 相似文献

4.

汉语连续语音识别之音素声学模型的改进 总被引：1，自引：1，他引：1

吕丹桔 Mei-Yuh Huang B Hoffmeister 《计算机仿真》2010,27(5):355-358

研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。相似文献

5.

德语语音合成中的字音转换研究 总被引：1，自引：1，他引：0

下载免费PDF全文

王永生《计算机工程与应用》2009,45(35):132-134

字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。相似文献

6.

英汉机器翻译系统中的词性标注研究 总被引：1，自引：1，他引：0

下载免费PDF全文

王永生《计算机工程与应用》2010,46(20):99-102

词性标注是英汉机器翻译系统中一个基础性的研究课题。提出了一种基于决策树的词性标注的非监督学习算法,在只有一个词库的有限条件下,通过决策树进行词性标注的非监督学习,生成词性标注规则。相似文献

7.

基于音素绑定码本映射的说话人声音转换方法 总被引：1，自引：0，他引：1

王子祥戴礼荣王玉平王仁华《模式识别与人工智能》2006,19(3)

介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问题,本文提出基于音素绑定的码本加权叠加方法来完成语音谱的转换,同时利用决策树来完成韵律的转换.实验表明,即使在数据量较少的情况下,该方法也能较好地完成说话人声音转换,并能得到较高的语音音质. 相似文献

8.

自监督聚类重训练的语音表示学习

张文林刘雪鹏牛铜杨绪魁屈丹《模式识别与人工智能》2022,(5):461-471

现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模型),利用无监督聚类得到音素类别伪标签.结合伪标签预测任务与重构任务,重新训练表示模型(学生模型).将学生模型作为新的教师模型,借助聚类与重训练,不断优化伪标签与语音表示模型.对比实验表明,经过聚类重训练后,语音表示模型在音素识别和说话人识别两项下游任务上均优于聚类重训练前的模型,性能较优. 相似文献

9.

英语语音合成中基于有限泛化法的字素切分规则的机器学习 总被引：1，自引：0，他引：1

王永生柴佩琪《计算机应用》2005,25(9):2010-2014

在英语语音合成中,由于英语有着几乎无限多的词汇,因此不可能创建包含所有词汇的词库。对于未包含在词库中的英语单词,通过“字母转换成音素（L2P）”算法自动生成其音标是一个最好的解决办法。而L2P首要的任务就是字素切分。为此,文中提出了一种有限泛化法（FGA）的机器学习算法,用于进行字素切分规则学习。用于学习的词典库有27040个单词,其中90％的词用于规则学习,剩下的10％用于测试。经过10轮交叉验证,学习实例和测试实例的平均实例切分正确率为99．84％和97．88％,平均单词切分正确率为99．72％和96．35％：平均规则数为472个。相似文献

10.

面向语音合成的藏语单音素与三音素自动切分算法研究

张金溪李永宏单广荣李照耀江静《计算机应用研究》2013,30(11):3272-3275

在构建藏语语料库时要对语音进行音素切分, 采用了两种方法, 即基于单音素HMM模型的自动切分方法和基于三音素HMM模型的自动切分方法。通过实验分析了这两种HMM模型的自动切分结果的准确率程度, 其中单音素、三音素总的平均切分准确度分别为80. 69%、88. 74%。实验结果表明, 三音素HMM模型的自动切分方法的准确率明显高于单音素HMM模型的切分率, 提高了语音语料库标注信息的精确度和一致性。相似文献