首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计特征的数学公式抽取方法的研究
引用本文:田学东,张立平,杨捧. 基于统计特征的数学公式抽取方法的研究[J]. 计算机工程, 2006, 32(19): 211-213
作者姓名:田学东  张立平  杨捧
作者单位:河北大学数学与计算机学院,保定,071002
摘    要:在分析公式特征的基础上,提出了一种将Parezen窗和Bayes分类规则相结合的公式抽取方法。对于孤立式公式采用改进后的Parzen窗方法将其从文档中抽取出来,对于内嵌公式通过Bayes分类规则将其从文本行中抽取出来。实验表明,这种抽取方法对中文文档具有较好的适应性和较高的成功率。

关 键 词:OCR技术  数学公式抽取  Bayes法则
文章编号:1000-3428(2006)19-0211-03
收稿时间:2005-10-23
修稿时间:2005-10-23

Research on Mathematical Formulas Extraction from Chinese Document Based on Statistical Features
TIAN Xuedong,ZHANG Liping,YANG Peng. Research on Mathematical Formulas Extraction from Chinese Document Based on Statistical Features[J]. Computer Engineering, 2006, 32(19): 211-213
Authors:TIAN Xuedong  ZHANG Liping  YANG Peng
Affiliation:College of Mathematics and Computer, Hebei University, Baoding 071002
Abstract:Based on the analysis of formula features, an approach composed of Parzen windows and Bayes theorem is proposed to extract mathematical formulas. Improved Parzen windows approach is used to extract the isolated formulas from the printed documents and Bayes theorem is used to extract the embedded formulas from the text lines. The experiments show that the combination of the two methods can obtain satisfactory results.
Keywords:OCR technique   Mathematical formulas extraction   Bayes theorem
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号