首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
基于Parzen窗的印刷文档数学公式抽取的研究   总被引:3,自引:0,他引:3  
数学公式抽取是公式识别的首要步骤,目前相关的研究还很欠缺。针对印刷文档中数学公式的抽取展开了研究,提出了一种Parzen窗和启发式规则相结合的公式抽取方法。对于孤立式公式采用Parzen窗方法将其从文档中抽取出来,对于嵌入式公式采用启发式规则将其从文本行中抽取出来。实验表明,这两种抽取方法的结合取得了较好的效果。  相似文献   

2.
基于统计特征的数学公式抽取方法的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
田学东  张立平  杨捧 《计算机工程》2006,32(19):211-213
在分析公式特征的基础上,提出了一种将Parezen窗和Bayes分类规则相结合的公式抽取方法。对于孤立式公式采用改进后的Parzen窗方法将其从文档中抽取出来,对于内嵌公式通过Bayes分类规则将其从文本行中抽取出来。实验表明,这种抽取方法对中文文档具有较好的适应性和较高的成功率。  相似文献   

3.
基于神经网络的印刷体数学公式抽取方法*   总被引:1,自引:0,他引:1  
在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。  相似文献   

4.
数学公式识别系统:MatheReader   总被引:9,自引:0,他引:9  
靳简明  江红英  王庆人 《计算机学报》2006,29(11):2018-2026
数学公式广泛存在于各类文献之中,但是公式的识别远比文字段落的识别困难.义章介绍了一个数学公式图像识别系统MatheReader,重点阐述了其在公式定位及公式分析方面的技术方案.在公式定伉方面,抽取版式特征,采用Parzen分类器区分独立公式和普通文字行,在普通文字行内检测二维结构定位内嵌公式.在公式分析方面,定义十一种基本公式类型,并用产生式规则限定每类公式的唯一分解方法,提出先识别公式类型,然后分解为子表达式的公式分析方法.和已有系统比较,MatheReader的功能更加强大,能够处理的公式更加丰富.  相似文献   

5.
针对目前光学字符识别技术(OCR)较难实现对中文文献中的数学公式进行识别,提出一种改进算法来解决印刷体内嵌数学公式的识别问题。通过添加新的特征值进行文本行分类,对内嵌公式行按字符逐一分割,再从分类后的文本行中依次提取出数学公式。实验结果表明,该算法具有识别率高、高效特点,与现有同类算法比较,在解决中文印刷体的数学公式识别问题方面的优势明显。  相似文献   

6.
基于模糊决策树的文本分类规则抽取   总被引:8,自引:0,他引:8  
王煜  王正欧 《计算机应用》2005,25(7):1634-1637
提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。  相似文献   

7.
数学公式图像识别与理解是文档图像处理领域的重要组成部分,目前尚无满足一般应用的处理方法. 提出了一种鲁棒的数学公式结构理解方法,使用公式图像识别结果、语法规则和句法规则分析数学公式结构,对数学公式的类型进行了完整的划分,对识别结果的错误进行自动的检查和纠正,能够自动分析数学公式符号的优先级和计算顺序. 既可以应用于数学公式图像的识别与格式转换,也可应用于对数学公式的检索和辅助编辑. 基于1 000个真实公式图像的实验结果证明了分析方法的有效性和稳定性.  相似文献   

8.
提出了一种先版面行分类后符号识别的印刷体数学公式提取策略。策略中两次应用K-L变换,分别完成版面行特征的降维和公式符号特征的提取,并采用免疫克隆选择算法优化支持向量机的训练参数,以构建出最优的版面行分类器和公式符号识别器。通过对300多份印刷体中文科技文档进行扫描识别测试,所得结果的公式提取率可达94%以上。  相似文献   

9.
为了找到模糊分类规则的优化集,以改善与数据挖掘中分类问题有关的数据探索与开拓的性能,提出了在分类问题中利用模拟退火(SA)技术.对构建模糊分类器的SA元启发搜索机制进行了研究,该搜索机制能够从输入数据集中抽取精确的模糊if-then规则.在UCI数据集上用计算机进行了模拟,实验结果表明了基于模拟退火的模糊分类系统对于分类输入向量的鲁棒性.  相似文献   

10.
分类是许多研究领域的关键问题,模糊规则的提取质量对分类器的性能又有着极大影响.所提取的规则不仅在分类能力上要达到最优,同时在规则数量上也不能太多,否则会影响规则搜索和匹配的速度.结合人工免疫的克隆选择原理,采用克隆选择算法,提取通过多精度模糊分割产生的大量模糊if—then规则中的少数精华规则,从而建立了模糊分类所需要的有效规则集合,同时还对优化目标函数进行了改进.经仿真实验证明,该方法所提取的模糊规则具有分类准确率高,规则数目较少等特点。  相似文献   

11.
12.
基于论域公式引入软命题逻辑公式概念,给出软命题逻辑公式的模糊软语义解释.将决策模糊信息系统转化为决策模糊软集,软决策规则表示为包含有蕴含联结词的软命题逻辑公式.引入软命题逻辑公式的基本真度、条件真度、绝对真度等指标,从充分性、必要性等方面评价软决策规则的有效性、合理性.提出基于决策软集的典型软决策规则提取算法和基于软决策分析的推荐算法,并通过实例和数值实验证明算法的有效性.  相似文献   

13.
Based on the credibility distributions which are analytic expressions of fuzzy variables, Fourier spectrum of credibility distribution for fuzzy variable, a useful mathematical analytic tool dealing with fuzzy variables, is introduced. Then several elementary properties of Fourier spectrums of credibility distributions for fuzzy variables are studied. Furthermore some relations between credibility distributions and Fourier spectrums such as inversion formula and uniqueness theorem are established.  相似文献   

14.
提出从Fuzzy数据向Vague数据的两个转化公式,提出Vague集之间的相似度量公式。数据转化公式和相似度量公式是Vague模式排序法的两个基础。该方法能进行目标价值排序,也能为如何选择更重要攻击目标提供理论依据。应用实例表明Vague模式排序法是实用的。  相似文献   

15.
在实单位区间[0,1]具有一定概率分布的基础上,引入命题逻辑公式的随机模糊意义下的真度概念,指出随机真度是已有文献中各种命题逻辑真度的共同推广.利用随机模糊真度定义公式间的随机模糊相似度,导出全体公式集上的一种伪距离——随机模糊逻辑伪距离,证明在随机模糊逻辑伪距离空间无孤立点.利用概率论中的积分收敛定理,证明一个关于随机模糊真度的极限定理.研究已有各种真度之间的联系.证明随机逻辑伪距离空间中逻辑运算的连续性,并将概率逻辑学基本定理推广至多值命题逻辑.在随机逻辑伪距离空间中提出2种不同类型的近似推理模式并应用于实际问题的近似推理.  相似文献   

16.
k-LSAT(k≥3)是NP-完全的(英文)   总被引:1,自引:0,他引:1  
合取范式(conjunctive normal form,简称CNF)公式F是线性公式,如果F中任意两个不同子句至多有一个公共变元.如果F中的任意两个不同子句恰好含有一个公共变元,则称F是严格线性的.所有的严格线性公式均是可满足的,而对于线性公式类LCNF,对应的判定问题LSAT仍然是NP-完全的.LCNF≥k是子句长度大于或等于k的CNF公式子类,判定问题LSAT≥k的NP-完全性与LCNF≥k中是否含有不可满足公式密切相关.即LSAT≥k的NP-完全性取决于LCNF≥k是否含有不可满足公式.S.Porschen等人用超图和拉丁方的方法构造了LCNF≥3和LCNF≥4中的不可满足公式,并提出公开问题:对于k≥5,LCNF≥k是否含有不可满足公式?将极小不可满足公式应用于公式的归约,引入了一个简单的一般构造方法.证明了对于k≥3,k-LCNF含有不可满足公式,从而证明了一个更强的结果:对于k≥3,k-LSAT是NP-完全的.  相似文献   

17.
文中从方便学习者使用异构移动终端进行数学公式及图形查询的角度出发,设计了一种基于WebServices四层架构的移动数学公式及图形查询系统。该系统的服务端使用J2EE开发,客户端使用J2ME开发,以支持学习者通过不同分辨率、不同操作系统的移动设备查询常用公式、函数及图形,另外,该系统还使用MobileSVG技术生成矢量数学图形,并将Ajax、gzip等技术用于提升性能,能大大提升查询速度、节省移动客户端的有效存储空间。该系统的架构和所采用的技术克服了目前移动设备访问网络资源速度较慢、存储量较小、分辨率不同等各种影响学习效果的不利因素,因此能为学习者提供更好的移动数学学习支持。具有很好的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号