首页 | 本学科首页   官方微博 | 高级检索  
     

一种印刷体数学公式优化提取策略
引用本文:张灿龙,唐艳平,王强,韦春荣.一种印刷体数学公式优化提取策略[J].计算机工程与应用,2010,46(15):146-149.
作者姓名:张灿龙  唐艳平  王强  韦春荣
作者单位:1. 广西师范大学,计算机科学与信息工程学院,广西,桂林,541004;上海交通大学,航空航天学院,上海,200240
2. 桂林电子科技大学,材料科学与工程学院,广西,桂林,541004
3. 广西师范大学,计算机科学与信息工程学院,广西,桂林,541004
基金项目:广西壮族自治区科技厅基金项目(桂科基0640067);;广西师范大学青年骨干教师基金项目(师政科技[2009]7号)
摘    要:提出了一种先版面行分类后符号识别的印刷体数学公式提取策略。策略中两次应用K-L变换,分别完成版面行特征的降维和公式符号特征的提取,并采用免疫克隆选择算法优化支持向量机的训练参数,以构建出最优的版面行分类器和公式符号识别器。通过对300多份印刷体中文科技文档进行扫描识别测试,所得结果的公式提取率可达94%以上。

关 键 词:印刷体数学公式  支持向量机  K-L变换  免疫克隆选择
收稿时间:2009-12-8
修稿时间:2010-3-17  

Printed mathematical expressions extraction method based on ICSA-SVM and K-L transform
ZHANG Can-long,TANG Yan-ping,WANG Qiang,WEI Chun-rong.Printed mathematical expressions extraction method based on ICSA-SVM and K-L transform[J].Computer Engineering and Applications,2010,46(15):146-149.
Authors:ZHANG Can-long  TANG Yan-ping  WANG Qiang  WEI Chun-rong
Affiliation:1.College of Computer Science and Information Engineering,Guangxi Normal University,Guilin,Guangxi 541004,China 2.School of Material Science and Engineering,Guilin University of Electronic Technology,Guilin,Guangxi 541004,China 3.School of Aeronautics & Astronautics,Shanghai Jiaotong University,Shanghai 200240,China
Abstract:A new approach for separating both isolated and embedded expressions in printed Chinese technical documents is presented,which includes two steps:line classification and symbol recognition.In the approach,K-L transform is applied to eliminate interrelation among line features and extract symbol features,and immune clone selection algorithm is used to optimize parameters of line classifier and symbol classifier based on support vector machine.The testing result to about 300 printed Chinese technical document...
Keywords:printed mathematical expression  support vector machine  K-L transform  Immune Clone Selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号