基于语言知识的手写汉语文本自动识别初探 |
| |
作者姓名: | 杨经 方应谦 |
| |
作者单位: | 郑州电子技术学院一系 |
| |
摘 要: | 文中首先从信息开销的角度分析了识别一个汉字所需要的信息量。研究表明,单字识别算法是一种等概模型,需要的信息最多。因此,可把汉字文本当作Markov模型来处理,当前汉字的发生仅依赖于前m个汉字。根据对文本的统计,得到许多语言统计信息,在此基础上,设计了利用语言知识基于句子的文本自动识别方法。识别时当前待识字的匹配仅在前一个字的后邻接字集里进行;当一个句子识别完后,对其进行语言知识处理后再输出结果。因
|
关 键 词: | 语言知识 汉语文本 汉字识别 汉字信息处理 |
本文献已被 CNKI 维普 等数据库收录! |
|