首页 | 本学科首页   官方微博 | 高级检索  
     

利用上下文相关信息的汉字文本识别
引用本文:夏莹 常新功. 利用上下文相关信息的汉字文本识别[J]. 中文信息学报, 1996, 10(1): 23-30
作者姓名:夏莹 常新功
作者单位:清华大学计算机系
摘    要:
为了改善汉字文本识别率, 本文提出了一种基于语料库统计概率的后处理方法, 该方法利用上下文相关信息, 超过词汇对于汉字文本识别, 把具有确定性边界的一个汉字序列多数情况为一个句子作为一个处理单元, 利用统计获得的字字同现概率,采用动态规划方法, 获得了令人满意的效果。

关 键 词:汉字识别  语料库语言学  MARKOV模型  后处理  

Chinese Text Recognition Using Contextual Information
Xia Ying,Chang Xin-gong,Ma shao-ping,zhu xiao-yan,jin yi-jiang. Chinese Text Recognition Using Contextual Information[J]. Journal of Chinese Information Processing, 1996, 10(1): 23-30
Authors:Xia Ying  Chang Xin-gong  Ma shao-ping  zhu xiao-yan  jin yi-jiang
Abstract:
In order to improve Chinese text recognition rate, in this paper we present a post processing method of corpus-based statistical probabilities. The method has used contextual information more than the lexical lever knowledge. For Chinese text recognition, a bounded seguence of Chinese characters (more often, a sentence) is processed as an unit. And the cooccurrence probability between characters and dynamic progamming strategy are employed to acquire the satisficatory recognition results.
Keywords:Chinese Characters Recognition   Corpus Linguistics   Markov Model   Post processing  
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号