首页 | 本学科首页   官方微博 | 高级检索  
     

音字转换中分层解码模型的研究与改进
引用本文:张顺昌,孙乐.音字转换中分层解码模型的研究与改进[J].中文信息学报,2009,23(6):79-86.
作者姓名:张顺昌  孙乐
作者单位:1. 中国科学院 软件研究所,北京 100190;
2. 中国科学院 研究生院,北京 100049
基金项目:国家自然科学基金资助项目,国家863计划重点资助项目 
摘    要:音字转换是中文信息处理领域的一个重要研究方向,在语音识别、中文拼音输入中都有广泛应用。该文对音字转换中的拼音流切分歧义问题做了分析与研究,发现传统的分层隐马尔可夫解码模型在解决这个问题时存在缺陷,提出了利用语言模型知识辅助拼音流切分来改进已有的分层模型的思想。实验表明,与传统方法相比,该文的方法可以将首字准确率提高3%。

关 键 词:人工智能  自然语言处理  音字转换  HMM模型  中文信息处理  切分歧义
  

The Research on Hierarchical Decoding for Pinyin-to-Character Conversion
ZHANG Shunchang,SUN Le.The Research on Hierarchical Decoding for Pinyin-to-Character Conversion[J].Journal of Chinese Information Processing,2009,23(6):79-86.
Authors:ZHANG Shunchang  SUN Le
Affiliation:1. Institute of Software, Chinese Academy of Chinese, Beijing 100190, China; 2. Graduate University of Chinese Academy of Sciences, Beijing 100049, China
Abstract:Pinyin-to-Character conversion is an important task in Chinese Information Processing with widely applications in such tasks as Chinese Speech Recognition, Chinese Pinyin input method et al. This paper investigates the Pinyin-to-Character conversion and the segmentation of pinyin stream and proposes a method using Language Model to improve pinyin stream segmentation model. This method achieves about 3% enhancement in precision of the first character compared to the traditional hierarchical model.
Keywords:artifical intelligence  natural language processing  pinyin-to-character conversion  hidden markov model  Chinese information processing  segmentation ambiguity
本文献已被 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号