首页 | 本学科首页   官方微博 | 高级检索  
     

一种在线递增式语言模型自适应方法
引用本文:吴根清,郑方,金凌,吴文虎. 一种在线递增式语言模型自适应方法[J]. 中文信息学报, 2002, 16(1): 61-66
作者姓名:吴根清  郑方  金凌  吴文虎
作者单位:清华大学计算机科学与技术系,智能技术与系统国家重点实验室,语音技术中心
摘    要:本文针对传统统计语言模型的离线自适应方法,提出了一种在线实时的递增式自适应方法。该自适应方法需要解决几个问题。第一是要设计一种语言模型结构以适应在线的自适应;第二是如何利用在线收集到的语料对语言模型进行实时的参数修改;在我们设计的中文音转字平台中,将语言模型分成两个部分,分别是通用模型和用户模型。对于通用模型,采用高效的存储结构结合参数预取技术,提高了模型的速度;对于用户模型,使用动态的加权方法结合MAP 动态调整参数。本文所做的实验证明使用该方法能较大程度的降低中文音转字的错误率。

关 键 词:统计语言模型  N-gram  自适应  语音识别  

An Online Incremental Language Model Adaptation
WU Gen qing ZHENG Fang JIN Ling WU Wen hu. An Online Incremental Language Model Adaptation[J]. Journal of Chinese Information Processing, 2002, 16(1): 61-66
Authors:WU Gen qing ZHENG Fang JIN Ling WU Wen hu
Affiliation:The State Key laboratory of Intelligence Technology and System Department of Computer Science and Technology Tsinghua University
Abstract:In this paper,an online incremental language model adaptation method is proposed,which is different from the traditional offline language model adaptation method.There are some problems in the online incremental adaptation.The first one is how to design a flexible framework for online adaptation,the second one is how to adjust the parameters of the model incrementally according to the corpus collected online.In our application platform,the whole model is divided into two parts--the background model and the user model respectively.An effective storage structure,integrating with parameter looking ahead technique,accelerates the visiting procedure; a dynamic weighting MAP method is proposed to adjust the parameters in the user model.Experiments show that it can achieve a comparative Chinese character error rate reduction in Chinese Pinyin to Hanzi translation.
Keywords:stochastic language model  N-gram  adaptation  speech recognition  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号