首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
2.
为了从中英文混排的中文文档中定位数学公式,提出了一种基于中文字符识别和公式符号识别的数学公式定位方法。该方法主要由中文字符提取、内嵌公式提取和独立公式定位三个部分组成。在中文字符提取中,首先提取字符块信息中文字符识别结果、公式符号识别结果和字符块的几何特征,然后使用决策树的方法区分中文字符和非中文字符。在内嵌公式提取中,使用公式符号的语义信息、符号间的角标关系和公式的语义信息等从非中文字符中定位内嵌公式。在独立数学公式定位中,对包含较多内嵌公式符号且不包含中文字符的文字行提取版式结构特征,并使用高斯混合模型区分独立公式和普通文字行。在148幅文档图像共包含3 690个公式组成的测试集上取得了91.19%的公式定位正确率。  相似文献   

3.
根据数学公式中字符或符号间空间关系特点,并针对目前用于数学公式字符空间关系判别的区域和质心方法所存在的不足,提出了基于字符凸壳和模糊识别的字符空间关系判别方法.首先,对数学公式中的字符或符号进行分类,对每一类运用字符凸壳判别其正上和正下关系,然后应用模糊识别的方法对常见关系进行识别.实验结果表明,运用该方法能明显提高字符空间关系判别的识别率,识别的正确率可达到93.5%.  相似文献   

4.
中文科技文档中的数学表达式定位   总被引:1,自引:0,他引:1  
数学表达式定位是印刷体数学表达式识别的前提。针对中文科技文档,分别对独立表达式和内嵌表达式的定位问题提出了新的方法。采用自适应神经模糊推理系统(ANFIS) 对行特征进行分类,提取出独立表达式;采用模糊聚类和动态规划方法,从文档中依次提取出汉字、中文标点和英文字符,利用启发式规则合并剩余的数学符号而提取出内嵌表达式。实验表明,提出的表达式定位方法有很高的正确率。  相似文献   

5.
数学公式中字符和符号间空间关系的识别   总被引:2,自引:0,他引:2  
文章根据笔写数学公式中字符或符号间空间关系的特点,提出了一种识别方法。首先,对数学公式中的字符和符号进行分类,对每一类提出了相应的正上和正下关系识别方法,然后应用模糊识别的方法对常见关系进行识别。因为根号的特殊性,它被作为一种特殊情况加以处理。实验表明,识别的正确率可达到93.4%。  相似文献   

6.
为了正确分离图文,提出一种基于字符群体特征的图文分离算法.该方法以直线识别得到的短直线为基础,对连通域进行限制长度的外轮廓提取;通过大小和密度判据捡出候选字符,并以字符串形式出现的群体特征吸收漏识的字符和符号,实现包含标注字符、标题栏及明细栏字符等各类字符与图形位图的分离.结果表明:该算法提高了字符特别是难检字符及符号判定的可靠性,保持了字符串的完整性,具有适应性强、效果好的特点.  相似文献   

7.
针对手写数学公式的识别和计算问题,提出了一种基于卷积神经网络的字符训练方法。利用计算机视觉对数学公式图片进行预处理,采用卷积神经网络进行二维矩阵转换,得到了对应的字符符号,通过后缀表达式计算了识别结果。运用Softmax函数训练了字符模型,统计和分析了几种类型的数学公式识别和计算结果。实验结果证明,通过训练字符能有效提高正确率,该方法可为复杂手写数学公式识别和计算提供参考。  相似文献   

8.
该文通过对包含有数学公式的图片进行二值化、灰度化等图像预处理,为了要精确的进行数学公式分割,需要精准的提取出数学公式的各种特征.每个字符的主要特征就是它的骨架,通过对数学公式字符图像进行数学形态学的细化处理,然后接着进行字符骨架提取,最后使用轮廓投影的方法对图片进行分割,最后把分割的结果进行归一化处理.  相似文献   

9.
在印刷体数学公式识别中,不能很好地切分粘连字符是造成识别错误的主要原因。针对这种情况,提出了一种基于滑动窗口切分粘连字符的方法。通过特征值比较.提取出粘连字符,然后对粘连字符切分。实验表明,这种方法使识别率得到了提高。  相似文献   

10.
数学表达式识别方法综述   总被引:10,自引:1,他引:10  
数学表达式的识别是将科学和工程文献中的数学公式转变成电子文档的一种形式。数学表达式的识别由符号识别和结构分析组成,符号识别又分两大阶段,即符号的分割和识别。本文介绍了目前数学表达式识别的研究现状,给出了数学表达式识别的过程和已提出的符号识别方法和结构分析方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号