首页 | 本学科首页   官方微博 | 高级检索  
     

普通话发音错误自动检测技术
引用本文:张峰,黄超,戴礼荣.普通话发音错误自动检测技术[J].中文信息学报,2010,24(2):110-116.
作者姓名:张峰  黄超  戴礼荣
作者单位:1. 中国科学技术大学 电子工程与信息科学系 科大讯飞语音实验室,安徽 合肥 230027;
2. 微软亚洲研究院,北京 100080
摘    要:统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。 该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。

关 键 词:计算机应用  中文信息处理  发音错误自动检错  说话人自适应训练  选择性最大似然线性回归  话者归一化  

Automatic Mispronunciation Detection for Mandarin Chinese
ZHANG Feng,HUANG Chao,DAI Lirong.Automatic Mispronunciation Detection for Mandarin Chinese[J].Journal of Chinese Information Processing,2010,24(2):110-116.
Authors:ZHANG Feng  HUANG Chao  DAI Lirong
Affiliation:1. iFly Tek Speech Lab, Department of Electronic Engineering and Information Science, University of Science
and Technology of China, Heifei, Anhui 230027,China; 2. Microsoft Research Asia, Beijing 100080, China
Abstract:The current automatic mispronunciation detection systems are mostly based on automatic speech recognition(ASR) framework with statistical model.This paper presents the methods to improve the performance of mispronunciation detection at syllable level for Mandarin Chinese from two aspects: introducing the speaker adaptive training(SAT) and the selective maximum likelihood linear regression(SMLLR) to get a better acoustic statistical model,and proposing speaker normalization backend because of the limited inf...
Keywords:computer application  Chinese information processing  Automatic mispronunciation detection  Speaker Adaptive Training (SAT)  Selective Maximum Likelihood Linear Regression (SMLLR)  speaker normalization
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号