首页 | 本学科首页   官方微博 | 高级检索  
     

基于WFST的俄语字音转换算法研究
引用本文:冯伟,易绵竹,马延周.基于WFST的俄语字音转换算法研究[J].中文信息学报,2018,32(2):87.
作者姓名:冯伟  易绵竹  马延周
作者单位:战略支援部队信息工程大学 洛阳校区,河南 洛阳 471003
基金项目:洛阳市社会科学规划项目(2016B285)
摘    要:在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在此基础上,实现了一种数据驱动的俄语字音转换算法,将加权有限状态转化器(WFST)应用于算法的对齐、建模和解码过程中。首先利用期望最大化算法以“多对多”的方式对俄语字音进行对齐,然后将对齐结果通过联合N-gram模型训练,并转化为WFST发音模型,最后通过WFST解码算法对任意单词的发音进行预测。交叉验证实验结果表明,平均词形正确率为62.9%,平均音素正确率为92.2%。

关 键 词:字音转换  俄语  发音词典  加权有限状态转化器  

Algorithm of Grapheme-to-Phoneme Conversion for Russian Based on WFST
FENG Wei,YI Mianzhu,MA Yanzhou.Algorithm of Grapheme-to-Phoneme Conversion for Russian Based on WFST[J].Journal of Chinese Information Processing,2018,32(2):87.
Authors:FENG Wei  YI Mianzhu  MA Yanzhou
Affiliation:The PLA Strategic Support Force Information Engineering University Luoyang Campus, Luoyang, Henan 471003, China
Abstract:
Keywords:G2P  Russian  pronunciation dictionary  WFST  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号