期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2019,(1)

字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. 03%。相似文献

2.

德语语音合成中的字音转换研究 总被引：1，自引：1，他引：0

下载免费PDF全文

王永生《计算机工程与应用》2009,45(35):132-134

字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。相似文献

3.

面向语音合成的藏语单音素与三音素自动切分算法研究

张金溪李永宏单广荣李照耀江静《计算机应用研究》2013,30(11):3272-3275

在构建藏语语料库时要对语音进行音素切分, 采用了两种方法, 即基于单音素HMM模型的自动切分方法和基于三音素HMM模型的自动切分方法。通过实验分析了这两种HMM模型的自动切分结果的准确率程度, 其中单音素、三音素总的平均切分准确度分别为80. 69%、88. 74%。实验结果表明, 三音素HMM模型的自动切分方法的准确率明显高于单音素HMM模型的切分率, 提高了语音语料库标注信息的精确度和一致性。相似文献

4.

英语语音合成中基于DFGA的字音转换算法

王永生柴佩琪宣国荣《计算机工程与应用》2006,42(13):158-161,190

在英语语音合成中,由于英语有着几乎无限多的词汇,我们不可能创建包含所有词汇的词库。因而对于未包含在词库中的英语单词,通过“字素转换成音素(G2P)”算法自动生成其音标是一个最好的解决办法。为此,论文提出了一种动态有限泛化法(DFGA)的机器学习算法,用于进行字素/音素转换规则的学习。用于学习的词典库有27040个单词,其中90%的词用于规则学习,剩下的10%用于测试。经过10轮交叉验证,学习集和测试集的平均字素转换正确率为99.78%和93.14%,平均单词转换正确率为99.56%和73.51%。相似文献

5.

面向语音合成的维吾尔语音素自动切分算法研究 总被引：2，自引：0，他引：2

阿依木尼萨·胡甫尔艾斯卡尔·艾木都拉《计算机应用与软件》2011,(9)

结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。相似文献

6.

三音素模型的维吾尔语最佳文本选取算法 总被引：1，自引：1，他引：1

下载免费PDF全文

姑丽加玛丽·麦麦提艾力艾斯卡尔·肉孜艾斯卡尔·艾木都拉《计算机工程与应用》2009,45(18):242-244

利用上下文关联的思想,提出了三音素模型的大型句子文本库中选取最佳句子文本的算法,充分考虑了每个句子涵盖的不同三音素模型,利用贪婪算法去除了众多句子之间的冗余度,从而达到了选择文本容量最小化的目标。通过C#语言实现了本算法,给出了算法流程和算法性能分析,结果表明此算法的有效性和实用性。相似文献

7.

英语语音合成中基于有限泛化法的字素切分规则的机器学习 总被引：1，自引：0，他引：1

王永生柴佩琪《计算机应用》2005,25(9):2010-2014

在英语语音合成中,由于英语有着几乎无限多的词汇,因此不可能创建包含所有词汇的词库。对于未包含在词库中的英语单词,通过“字母转换成音素（L2P）”算法自动生成其音标是一个最好的解决办法。而L2P首要的任务就是字素切分。为此,文中提出了一种有限泛化法（FGA）的机器学习算法,用于进行字素切分规则学习。用于学习的词典库有27040个单词,其中90％的词用于规则学习,剩下的10％用于测试。经过10轮交叉验证,学习实例和测试实例的平均实例切分正确率为99．84％和97．88％,平均单词切分正确率为99．72％和96．35％：平均规则数为472个。相似文献

8.

基于汉盲对照语料库和深度学习的汉盲自动转换

蔡佳王向东唐李真崔晓娟刘宏钱跃良《中文信息学报》2019,33(4):60-67

汉盲转换是指将汉字文本自动转换为对应的盲文文本,其在盲文出版、盲人教育等领域具有重要应用价值,但当前已有系统性能难以满足实用需求。该文提出一种基于汉盲对照语料库和深度学习的汉盲自动转换方法,首次将深度学习技术引入该领域,采用按照盲文规则分词的汉字文本训练双向LSTM模型,从而实现准确度高的盲文分词。为支持模型训练,提出了从不精确对照的汉字和盲文文本中自动匹配抽取语料的方法,构建了规模为27万句、234万字、448万方盲文的篇章、句子、词语多级对照的汉盲语料库。实验结果表明,该文所提出的基于汉盲对照语料库和深度学习的汉盲转换方法准确率明显优于基于纯盲文语料库和传统机器学习模型的方法。相似文献

9.

一种快速简便的空心字转换算法

周振华《微电脑世界》1993,(5):65-67

相似文献

10.

基于不同长度拼接单元的英文文语转换系统

曾令平柴佩琪《计算机工程》2005,31(3):180-182

提出用不同长度的单元进行拼接的英语语音合成方法。实验表明,该方法能更好地利用自然语流的原始信息,提高合成语音的自然度,同时也能提高系统的灵活性和鲁棒性。相似文献

11.

面向汉语统计参数语音合成的标注生成方法

下载免费PDF全文

郝东亮杨鸿武张策张帅郭立钊杨静波《计算机工程与应用》2016,52(19):146-153

针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每个汉字的声韵母及声调;利用TBL（Transformation-Based error driven Learning）算法预测输入文本的韵律词边界和韵律短语边界。在此基础上,获得输入文本中每个汉字的声韵母信息及其上下文结构信息,从而产生统计参数语音合成所需的上下文相关标注。设计了一个以声韵母为合成基元的普通话的基于隐Markov模型（HMM）的统计参数语音合成系统,通过主、客观实验评测了不同标注信息对合成语音音质的影响,结果表明,上下文相关的标注信息越丰富,合成语音的音质越好。相似文献

12.

利用SAMPA实现藏语的字音转换

下载免费PDF全文

刘博杨鸿武甘振业郭威彤《计算机工程与应用》2011,35(35):117-121

机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际音标与SAMPA-T标注,并实现了面向SAMPA-T的藏语字音转换,可应用于藏语语音合成等藏语语音信息处理中。相似文献

13.

藏语口语语音语料库的设计与研究

下载免费PDF全文

黄晓辉李京马睿《计算机工程与应用》2018,54(13):231-235

基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。相似文献

14.

基于视频三音子的双模态语料自动选取算法 总被引：2，自引：2，他引：0

下载免费PDF全文

赵晖林成龙唐朝京《计算机工程》2009,35(17):1-3

为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。相似文献

15.

藏语连续语音语料库设计与实现 总被引：1，自引：0，他引：1

李永宏于洪志孔江平《计算机工程与应用》2010,46(13):233-235

以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文本语料库中的频度进行了详细的统计分析;最后在语音库的语料设计中综合考虑了三音子以及类三音子的覆盖率和稀疏度,设计并完成了语料抽取算法,实现了语料自动选取。相似文献

16.

A Generic Finite State Compiler for Tagging Rules

Wojciech?Skut Email author Stefan?Ulrich Kathrine?Hammervold 《Machine Translation》2003,18(3):239-250

We describe a novel method of compiling ranked tagging rules into a “bimachine”, i.e. a deterministic finite state device composed of two finite automata: a left-to-right one and a right-to-left one. The actual compilation is based on algorithms for finite state acceptors rather than transducers, which guarantees determinizability and the efficiency of compilation. The compiler has been used in a number of applications within a speech synthesis system. 相似文献

17.

英中可比语料库中多词表达自动提取与对齐 总被引：2，自引：1，他引：2

下载免费PDF全文

肖健徐建徐晓兰袁琦《计算机工程与应用》2010,46(31):130-134

多词表达（MWE）不仅用来提高当前机器翻译系统质量,而且也用于跨语言检索和数据挖掘等其他自然语言处理领域。为此,提出了基于语义模板与基于统计工具相结合的方法从三元组可比语料库中自动提取本族英语MWE。采用基于词表和分布方法计算词语间的相似度,扩大MWE覆盖范围。利用GIZA++对齐算法提取对译的中文MWE,依据统计方法计算互译概率信息,根据概率大小,选择最佳英汉MWE互译对。实验结果表明上述方法可以有效提高MWE提取和对齐的准确率。相似文献