首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
大家平常扫描识别一些文字资料的时候,通常会用到OCR文字识别软件,不过有时候手头没有这类软件或者懒得安装,这就需要笔者推荐的在线OCR网站来帮忙了。在线OCR识别网站(httP://www.netocr.net)应用了清华大学研制的国际领先OCR识别技术,支持TIF、BMP.JPG等多种常见图像格式,能识别出纯英文,简繁体中文,日文、韩文以及手写体和中英文混排的文本图像。通过它,可以从此告别OCR软件,随时随地轻松搞定文字识别。  相似文献   

2.
计算机文字识别的技术探讨与应用前景分析   总被引:1,自引:0,他引:1  
<正> 计算机文字识别,俗称光学文字识别,其英文术语为Optical Character Recognition(缩写为OCR),是指通过计算机技术及光学技术对印刷或书写的文字进行自动的识别,达到认知的目的,是实现文字高速自动录入的一项关键技术。 OCR技术的发展 OCR概念的诞生,要早于计算机的问世。1929年,Tausheck在德国提出了OCR的概念,并申请了专利。几年后,Handel在美国也提出了关于机器文字识别的想法,这一梦想,直到计算机诞生以后才得以实现。根椐我们掌握的资料,第一个名为ERA(Electric Reading Automation)的OCR软件  相似文献   

3.
经常用扫描仪的朋友可能对OCR并不陌生,OCR即Optical Character Recognition,中文含意就是光学字符识别的意思,就是将图像作一个转换,使图像内的图形继续保存、将文字识别出来,这样使人们从繁重的键盘录入的劳动中解脱出来。目前几乎所有扫描仪都附带有OCR识别软件,但遗憾的是即使是同一个OCR软件识别的正确率差距也较大。目前比较常见的OCR软件有清华紫光和尚书六号。  相似文献   

4.
经常用扫描仪的朋友可能对OCR并不陌生.OCR即Optiotd Character Recognition.中文含义就是光学字符识别的意思,就是将图像作一个转换,使图像内的图形继续保存.将文字识别出来.这样使人们从繁重的键盘录入的劳动中解脱出来。目前几乎所有扫描仪都附带有OCR识别软件.但遗憾的是即使是同一个OCR软件识别的正确率差距也较大。目前比较常见的OCR软件有清华紫光和尚书六号。  相似文献   

5.
打字速度再快,也不会有OCR识别速度快。如果你有大量的图片文件需要识别,那么在线OCR识别是一个不错的选择。OCR是Optical Character Recognition的缩写,被称作光学字符识别,它可以将被扫描图片上的文字信息迅速识别出来,  相似文献   

6.
你是不是也和我一样经常碰到这种情况,要将搜集到的大量纸质资料输入电脑中,对于不太擅长打字的我们,这真是一件令人头疼的事情。现在好了,有了扫描仪和 OCR( Optical Character Recgnition,光学字符识别)技术,这一切都可以轻松搞定。待输入的文稿只须用扫描仪轻轻一扫,再利用 OCR软件加以识别,便可将其转换为可编辑加工的文本文件,再也不用敲击键盘了,是不是很爽啊,下面就让我们以 Microtek的 Scanmaker为例介绍尚书 5号 OCR软件的使用,尚书 5号是集简体识别、繁体识别、英文识别和表格识别于一体的文字识别软件。   …  相似文献   

7.
针对日常应用的金融票据,我们使用计算机进行自动处理。在金融票据自动处理系统的多个环节,我们应用了OCR技术。在票据类型识别这一重要环节,我们对印刷体的表头信息进行OCR识别,进一步提高了对票据类型的识别率。我们还对表格中以中文大写数字,手写阿拉伯数字,勾选填写的信息项运用OCR技术进行处理,提高了票据自动处理系统的能力。  相似文献   

8.
Q:以前可以在Acrobat中直接识别文字,但自从更新到Acrobat XI,进行文字识别时总被提示Acrobat无法访问识别服务。请问这是什么原因?A:这可能是你在安装时没有选择OCR组件,可试着重新安装一遍,安装时将OCR组件选中。或者直接安装一款第三方OCR软件,  相似文献   

9.
Mini OCR     
刘嘉 《个人电脑》2005,11(8):232-232
目前所有扫描仪都附带了专业的OCR识别软件,可以把扫描仪扫进电脑中的图像中的文字识别出来,但这些商业软件对于我们从屏幕上抓取的包含文字的截图,识别率非常差。有什么软件可以解决这个问题呢?Mini OCR就可以。  相似文献   

10.
OCR我也行     
OCR,即Optical Character Recognition,也称OCR识别技术,使用扫描备将印刷文件读入,并将文件上的文字辨认后转换成计算机使用的文字编码。简单说,OCR识别技术可以利用扫描仪把要识别的文字扫描到电脑中,并且把文字提出来转换成文档文件。这样,就用不着打字了,只需要把转换好的文字进行适当的修改就可以了。  相似文献   

11.
《软件世界》1996,(3):63-63
1.什么是OCR? OCR是Optical Character Recognize(光学字符识别)的英文缩写。印刷字符识别系统采用扫描仪扫描成图像文件,由计算机通过OCR软件自动辨认成文本文件,经过修改、编辑、排版,一篇符合您要求的文章就存在您的电脑中,以备您随时调用、输出。 OCR的出现把人们从繁重的手工键入中解脱出来,尤其是印刷资料的再录入,更能体现它的高效。所以OCR是一种全新的输入方法。 2.汉字识别系统的构成 整个印刷汉字文本的识别过程包括:  相似文献   

12.
本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务系统所需录入文档能够在短时间内识别完成,并集成于OCR平台进行存储和管控,进而提升处理效率,在企业的研发、生产以及运营环节节省更多人力。  相似文献   

13.
集成汉英OCR系统识别中文名片   总被引:1,自引:0,他引:1  
汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片。实验数据表明,利用该原则构造的系统确实能有效集成汉英识别引擎,在纯中文识别率为89.86%,纯英文识别率为91.20%的情况下,使名片最终总体识别率达到了93.45%,较好地解决了汉英混排名片的识别问题。  相似文献   

14.
有些用户用Office2003的“Microsoft Office Document Imaging”识别图片中的文字,不过将这些文字复制到Word中有时会出现乱码。这是因为其默认设置造成的。在软件的中文版中,软件默认的OCR语言是“中文(简体)”,我们应该在识别之前将其更改为英文。单击“工具一选项“菜单项,在对话框的”OCR”标签下将“OCR语言”改成“英语”.确定后再执行OCR操作.这样将文字复制到Word中就不会出现乱码了。  相似文献   

15.
数学公式识别是OCR技术的重要组成部分,目前相关的研究还很欠缺。文章在简要介绍数学公式识别发展状况的基础上,针对结构分析这一公式识别的关键环节,提出了一种基于基准线、运算符作用域并结合语法分析数学公式结构的方法。实验表明,该方法对公式结构具有较好的适应性。  相似文献   

16.
传统的OCR技术在汉字识别领域趋于成熟,对背景清晰的正体汉字有很高的识别正确率,然而当汉字图片在复杂背景中或经旋转、加噪处理后,OCR软件的识别正确率大大下降.当今有关视频检索的研究正在快速发展中,其中一种行之有效的方法是通过提取模板视频的关键帧及其特征向量,应用聚类算法形成关键字,并通过快速的检索算法来实现匹配.创新性地将该模型应用到汉字识别研究中,通过大量实验数据的研究发现,该模型在上述情况中相对于传统的OCR技术优势明显,在未来实际应用中具有广阔的前景.  相似文献   

17.
汉王OCR5.0增强版是北京汉王科技公司推出的一款汉字表格OCR软件、该软件支持市场上销售的TWAIN标准的扫描仪,支持24位彩色、256级灰度扫描识别功能,提供识别完毕后的图文并存的彩色版面恢复,支待RTF、HTML的输出,不仅能识别众字体,还支持简繁混排汉字的识别、纯英文的识别、自动区分“横版”或“竖版”,还支持简体、繁体和英文。  相似文献   

18.
由于汉字笔画复杂,从视频中提取的汉字图像质量往往较差,采用传统光学字符识别(OCR)的结果不理想.为了解决低质量汉字图像的识别问题,提出一种基于分块搜索的两级识别方法.首先建立汉字图像的分块结构并模仿低质量汉字生成训练集,然后对训练集中各分块图像应用主成分分析提取特征并建立索引.待识别图像应用分块搜索和投票的方式从索引中获取候选汉字集合(一级识别),再根据投票结果的显著性辅以全局结构特征匹配识别汉字(二级识别).实验结果证明,该方法对于低质量汉字图像比普通的OCR方法具有更高的识别率.  相似文献   

19.
本文结合银行票据OCR系统的开发,提出一种基于知识进行银行票据二值化的新思路,并针对各类识别域具体构造了一整套二值化方法。通过在银行票据OCR系统中的应用,验证了本文二值化方法的效果。  相似文献   

20.
汉字是形、声、义有机组合的方块文字,其特点是数量浩大(常用汉字在4000到7000个)、结构繁杂、字体字形变化多端。要利用OCR技术来解决汉字的计算机自动输入问题面临着很大挑战。从80年代开始,我国国家863高技术发展计划、国家自然科学基金等对汉字自动识别输入的研究就给予了充分的重视,经过十多年的发展,印刷体汉字识别技术的进展及其应用,已受到世人瞩目。 一、中文OCR技术及其研究简介 中文OCR技术包括以下几个部分:  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号