共查询到18条相似文献,搜索用时 62 毫秒
1.
数学公式识别是OCR技术的重要组成部分,目前相关的研究还很欠缺。文中在简要介绍数学公式识别发展状况的基础上,针对结构分析这一公式识别的关键环节,提出了一种将“自顶向下”和“自底向上”策略相结合的数学公式结构分析方法。实验表明,这种方法对公式结构具有较好的适应性。 相似文献
2.
3.
数学公式识别是OCR技术的重要组成部分,目前相关的研究还很欠缺。文章在简要介绍数学公式识别发展状况的基础上,针对结构分析这一公式识别的关键环节,提出了一种基于基准线、运算符作用域并结合语法分析数学公式结构的方法。实验表明,该方法对公式结构具有较好的适应性。 相似文献
4.
在线手写数学公式结构分析算法 总被引:1,自引:0,他引:1
在线手写数学公式输入作为一种自然、快速的数学公式输入方法有着很大的应用前景。基于识别通用数学公式结构的范畴,提出了在线手写数学公式结构识别的算法。首先定义了数学公式结构的分形、支配关系并扩展了硬约规,同时根据手写公式的特点提出了最小生成树(MST)算法中一种新的权值计算方法,在此基础之上应用最小生成树算法和统计学的方法进行公式结构分析。与其他经典算法比较,所提算法扩大了识别的结构,同时识别正确率有所提高。 相似文献
5.
数学公式识别是OCR技术的重要组成部分,目前相关的研究还很欠缺.文中在简要介绍数学公式识别发展状况的基础上,针对结构分析这一公式识别的关键环节,提出了一种将"自顶向下"和"自底向上"策略相结合的数学公式结构分析方法.实验表明,这种方法对公式结构具有较好的适应性. 相似文献
6.
公式识别问题被分为字符分割和结构分析两部分内容。系统地研究了数学公式识别的全过程,使用自适应字符分割方法和基线结构分析算法成功地实现了一般数学公式的识别,识别率比较高,较好地完成了公式识别任务。从实验结果中可以看出,这种基于基线结构分析的数学公式识别方法能够满足大多数印刷体公式的识别,是一种较好的方法。 相似文献
7.
针对印刷体数学公式中的结构分析,提出将“自下而上”和“自上而下”相结合的策略。自上而下是针对特殊结构的分析,特殊结构包括根号、矩阵、上下标等。自上而下是对公式整体结构的分析,并且用递归的方式对各个子表达式采用同样的分析方法。结构分析成功后,用树形结构表示整个公式的二维空间布局。实验结果表明,此种分析策略有效地提高了印刷体数学公式的结构分析成功率。 相似文献
8.
本文源于一个手写数学公式识别系统,该系统实现了手写数学公式到文本公式的自动转化。文中提出了一种基于分块树的数学公式结构分析方法,该方法首先根据其内部结构特征将数学表达式分解为若干子模块,并采用树型结构对每个子模块内部字符之间的结构关系进行表示,最终形成整个表达式的树型表示。该方法定义了一系列的字符结构属性,将字符及属性值作为结构分析的结果,这些属性值再现了公式的结构特征,并很容易被系统的公式文本显示部分所利用。另外,该方法对传统的字符空间关系类型进行了简化,减小了识别误差,而引入的分块处理方式更加适合具有根式和分式等多层嵌套结构公式的处理,并且具有较强的可扩展性。 相似文献
9.
介绍了一个印刷体数学公式识别系统,它由公式字符识别和结构分析两部分组成。在公式字符识别中,采用了一些适用于公式字符的特殊处理方法;在结构分析中,根据数学公式的结构布局,采用了一种将“自顶向下”和“自底向上”策略相结合的数学公式结构分析方法,实现了数学公式的重用,实验表明,这种方法能取得较好的识别效果。 相似文献
10.
数学公式广泛存在于各类文献之中,因此数学公式的自动定位、识别、分析和理解是文档图像处理必须研究的问题.但是数学公式和普通文本存在很大区别,所以数学公式的识别、分析远比文字段落的识别困难.本文回顾了数学公式图像处理的研究历程,提出了公式处理的模型,总结比较了公式定位、公式识别、公式分析以及性能评估等方面的主要处理方法,并展望了未来的研究方向. 相似文献
11.
在印刷体数学公式识别中,不能准确地切分粘连符号是造成识别错误的主要原因之一。针对这种情况,提出了一种基于轮廓特征切分粘连符号的方法。根据轮廓特征及宽高比形成切分路径,然后对粘连字符切分。实验表明,这种方法使识别率得到了明显提高。 相似文献
12.
上下标关系数学公式中出现频繁又难于解决的特殊结构,容易与其它关系混淆.提出了基于模糊理论的数学公式上下标关系判别.运用模糊理论对数学公式中符号的空间区域关系进行划分,然后应用模糊识别的方法对上下标关系进行判别.实验结果表明,运用该方法能明显提高符号空间关系判别的识别率,尤其是能很好地判别手写数学公式中的空间关系,识别的正确率可达到96.4%. 相似文献
13.
提出了一种基于基准线的多候选数学公式识别(Baseline Based Multi-candidate Mathematical Expression Recognition,BBMMER)方法。现代印刷体数学公式识别是模式识别的重要组成部分,而数学公式结构分析又是数学公式识别技术发展的瓶颈所在。提出了一种利用基准线定位公式嵌套结构,多候选分析公式符号间结构关系的方法,并使用LaTex格式表示数学公式的识别结果。在大量的公式图像组成的测试集上取得了良好的公式分析正确率。 相似文献
14.
名片自动录入系统的实现 总被引:5,自引:0,他引:5
介绍了一个名片自动录入系统,它能利用名片版面的位置信息和名片知识分析名片版面属性,然后对分割的各区域进行字符识别,并对识别结果做基于名片知识和词语的后处理,最后从识别结果中提取有用信息录入到数据库的相应字段,完成名片数据库的自动录入。文中着重介绍基于模板匹配的版面分析算法和基于句法分析的后处理算法,同时也讨论了系统的构成。 相似文献
15.
数学表达式的识别过程中,结构分析是非常重要的一步。而符号关系的判定又是结构分析的关键。然而符号间关系的不确定性导致数学表达式运算含义的模糊性,已经成为数学公式识别中结构分析的一大难点。通过大量的统计数据,抽取出较为明显的特征,并引入多特征模糊模式识别的方法,建立隶属函数来判断印刷体数学公式符号的关系。实验结果表明,该方法适用范围较广,准确率较高,具有较强的鲁棒性。 相似文献
16.
基于灰度形态学的红细胞图像边缘检测 总被引:1,自引:0,他引:1
边缘包含了图像很多重要的信息,边缘检测的好坏也直接决定了后续处理的效果。在利用数学形态学进行边缘检测后,会出现不需要的边缘,形成噪声。针对这种情况,提出一种计算中心像素与邻域像素均方差的方法对形态学边缘检测算子进行改进,该方法可以有效减少噪声,为以后对红细胞图像进行特征提取和分类打下良好的基础。 相似文献
17.
A range-finding scanner can collect information about the shape of an (unknown) polygonal room in which it is placed. Suppose that a set of scanners returns not only a set of points, but also additional information, such as the normal to the plane when a scan beam detects a wall. We consider the problem of reconstructing the floor plan of a room from different types of scan data. In particular, we present algorithmic and hardness results for reconstructing two-dimensional polygons from point-wall pairs, point-normal pairs, and visibility polygons. The polygons may have restrictions on topology (e.g., to be simply connected) or geometry (e.g., to be orthogonal). We show that this reconstruction problem is NP-hard under most models, but that some restrictive assumptions do allow polynomial-time reconstruction algorithms. 相似文献
18.
数学表达式识别一般分为字符识别和结构分析两部分,而且大多数现有的方法是先进行字符识别然后将字符识别的结果作为结构分析的输入再进行结构分析,在这种分步识别的过程中,字符识别的错误会被继承到结构分析阶段,最终导致识别错误。关于数学表达式结构分析的问题,现有的方法大多是在假设所有的符号已经识别的基础上进行的。为了解决上述问题,提出了一种实时识别联机手写数学表达式的方法。该方法基于字符识别和结构分析的结合,动态地构建一棵数学表达式结构树来识别该数学表达式。在构建数学表达式树的过程中,采用了影响区域定位的方法,免去了其他不受影响区域的重复识别过程,因而提高了再次识别的效率,同时还弥补了现有实时识别方法不能乱序输入的缺陷。实验结果表明提出的方法可以得到比较满意的识别结果。 相似文献