首页 | 本学科首页   官方微博 | 高级检索  
     

基于LaTex的Web数学公式提取方法研究
引用本文:陈立辉,苏伟,蔡川,陈晓云.基于LaTex的Web数学公式提取方法研究[J].计算机科学,2014,41(6):148-154.
作者姓名:陈立辉  苏伟  蔡川  陈晓云
作者单位:兰州大学信息科学与工程学院 兰州730000;兰州大学信息科学与工程学院 兰州730000;兰州大学信息科学与工程学院 兰州730000;兰州大学信息科学与工程学院 兰州730000
基金项目:本文受国家自然科学基金项目(61003139,2),教育部-英特尔信息技术专项科研基金(MOE-INTEL-11-03),中央高校基本科研业务费专项资金(lzujbky-2013-39,lzujbky-2013-188,lzujbky-2013-187)资助
摘    要:数学论坛、Wiki等社会性网站对数学教育的影响日益增长,数学公式广泛存在这些网站中,如何对这些网站中的数学公式进行搜索,对学习和科研非常重要。数学公式提取是索引系统的前提和基础,文中主要研究LaTex格式的数学公式的提取方法,结合BNF表述方式,提出自动分析提取包含LaTex公式特征的方法。依据公式包含的特征,提出提取和过滤LaTex数学公式的方法规则。通过实验发现,该方法的查全率达到75%,查准率达到99%。

关 键 词:数学公式  LaTex  查准率  查全率  主题爬虫  搜索引擎
收稿时间:2013/8/23 0:00:00
修稿时间:1/6/2014 12:00:00 AM

Research of Extraction Method of Web Mathematical Formula Based on LaTex
CHEN Li-hui,SU Wei,CAI Chuan and CHEN Xiao-yun.Research of Extraction Method of Web Mathematical Formula Based on LaTex[J].Computer Science,2014,41(6):148-154.
Authors:CHEN Li-hui  SU Wei  CAI Chuan and CHEN Xiao-yun
Affiliation:School of Information Science and Engineering,Lanzhou University,Lanzhou 730000,China;School of Information Science and Engineering,Lanzhou University,Lanzhou 730000,China;School of Information Science and Engineering,Lanzhou University,Lanzhou 730000,China;School of Information Science and Engineering,Lanzhou University,Lanzhou 730000,China
Abstract:
Keywords:Mathematical formula  LaTex  Precision  Recall  Topic crawler  Search engine
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号