首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
OCR技术回顾 我国从80年代开始研制中文OCR技术,在国家科委的支持下,OCR支持取得了很快的进步,特别是经过1993年的印刷体汉字识别集成后,我国印刷体汉字识别系统开始由研究阶段正式步入产品化阶段。识别率指标基本满足用户需求。 OCR技术在近几年发展非常迅速,从最初的多字体、多字号混排,到最近的中英文混排、自动版面分析、自动角度检测及倾斜校正、表格识别、智能识别、智能后处理等。OCR的产品化方面也很活跃,不但将上述  相似文献   

2.
北京捷通软件有限公司推出的“录易”汉语智能输入输出系统综合了OCR、笔输入、语音输入等多种非键盘输入方式,而且使用非常简单。“录易”汉语智能输入输出系统将汉字扫描识别技术(OCR)、联机手写汉字识别(笔输入)技术和汉语语音识别(语音  相似文献   

3.
传统的OCR技术在汉字识别领域趋于成熟,对背景清晰的正体汉字有很高的识别正确率,然而当汉字图片在复杂背景中或经旋转、加噪处理后,OCR软件的识别正确率大大下降.当今有关视频检索的研究正在快速发展中,其中一种行之有效的方法是通过提取模板视频的关键帧及其特征向量,应用聚类算法形成关键字,并通过快速的检索算法来实现匹配.创新性地将该模型应用到汉字识别研究中,通过大量实验数据的研究发现,该模型在上述情况中相对于传统的OCR技术优势明显,在未来实际应用中具有广阔的前景.  相似文献   

4.
我国OCR技术自70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年汉字识别的研究进入一个实质性的阶段,取得了较大的成果,不少研究单位相继推出了中文OCR产品.我国OCR都是由OMR演变过来的,在对OCR识别进行研究过程中涌现出了一批杰出的科学家,如清华的吴佑寿院士、丁晓青教授、北信的张昕中教授、中科院的刘昌平博士、李明敬博士可以称作我国OCR研究开发队伍中的导航人,为此付出了不懈努力.二十多年的研究开发积累了大量人才,专家就有上百人,他们在我国的信息领域留下了奋斗的足迹.  相似文献   

5.
OCR(Optical Character Recognition)的中文全称是光学字符识别,它的工作原理是通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,实现文字的自动输入。目前市面是最为流行OCR软件为“尚书OCR文字识别系统”和“清华紫光OCR软件”,它们采用了同样的内核,在识别率和速度上几乎没有区别。它们都为32位系统,支持WINDOWS95/98/NT。在印刷文字识别上加入MMX优化,识别速度都比传统的OCR软件提高50%以上。两者在汉英双语同时混排时,识别率都  相似文献   

6.
汉字识别技术是中文信息处理计算机化的关键技术,一直被国家列为重大科技攻关项目。自中汉王科技公司在国家863计划的支持下,经过广大科技人员多年的努力,在技术上取得了重大突破,较好地解决了手写汉字计算机自动输入问题,并首次开发出汉王全智能阅读器(手写和印刷OCR系统)。汉王全智能阅读器(OCR系统)是印刷体、手写汉字的扫描识别及联机手写汉字识别—汉王笔三合一软件,它通过扫描仪把印刷、手写文稿扫描成图像、然后识别出相应的汉字代码,对  相似文献   

7.
非键盘输入是相对传统的键盘输入而言的,目前来看主要有手写识别、语音识別和光学字符识别等汉字输入方式,因此也称为手写输入或笔输入、语音输入和OCR。非键盘输入的概念的正式形成和发展起来是在1997年夏、秋。当时是为了区別于已经成熟的通过键盘编码实现的汉字输入方法,也是为了适应汉字从单纯的笔输入到笔、语音和OCR扫描输入方法等多种技术和产品组合的发展。随着手写识別技术的逐步成熟和语音识別技术的突破,到1998年秋天非键盘输入已进入成熟期。其标志是相应的产品大规模上市,形成了具有一定规模的市场,并有多家产品在其中进行竞争。非键盘汉字输入技术包括了从硬件、软件及人机接口的一系列技术。其中独有的核心技术有联机手写汉字识别技术、脱机手写文稿识別技术、脱机印  相似文献   

8.
顾而智 《电脑》1995,(4):16-17,15
自计算机应用到信息处理领域,汉字的输入似乎就成了我们中国人“永恒”的话题.作为十多年计算机汉字输入主流的汉字键盘编码输入,其输入方案已上千种,输入速度也与西文不相上下,但专家与用户对现状仍然诸多不满意,仍觉得没有达到“易学好用”的境界.随着计算机技术的发展,特别是微型计算机硬件性能的迅速提高,近几年来掀起一股笔输入技术及其产品的研究热潮,学术界和业界都认为汉字笔输入很有发展前途,预期汉字笔输入将与键盘输入、声音输入和扫描输入一起主宰中文计算机输入的未来.  相似文献   

9.
《软件世界》1996,(3):63-63
1.什么是OCR? OCR是Optical Character Recognize(光学字符识别)的英文缩写。印刷字符识别系统采用扫描仪扫描成图像文件,由计算机通过OCR软件自动辨认成文本文件,经过修改、编辑、排版,一篇符合您要求的文章就存在您的电脑中,以备您随时调用、输出。 OCR的出现把人们从繁重的手工键入中解脱出来,尤其是印刷资料的再录入,更能体现它的高效。所以OCR是一种全新的输入方法。 2.汉字识别系统的构成 整个印刷汉字文本的识别过程包括:  相似文献   

10.
OCR是Optical Character Recognize(光学字符识别)的英文缩写。它的出现把人们从繁重的手工键入中解脱出来,你只需给计算机配上一台扫描仪加上OCR印刷汉字识别软件,就可以轻松完成长篇文字的录入工作。 一、汉字识别系统的构成 整个印刷汉字文本的识别过程包括: (1)原始文稿的扫描输入:一般图象扫描仪将文稿扫描输  相似文献   

11.
近来工作较为清闲,总想把以前的照片跟资料转录到电脑中做一下处理和归档,数码相机和扫描仪就成了当然的选择,但考虑到性能高的数码相机价格不菲,且呈熊市缓慢下行;而一些老照片用数码相机翻照会造成相当程度的失真,因此扫描仪无疑成了当然的选择。同时,由于工作需要,要将大量的文档与数据录入到电脑中形成数据库以便查询的话,这时发挥扫描仪重要功效的另一重型武器OCR无疑就成了首选,OCR是英文Optical Character Recognition的缩写,意思为光学字符识别,是扫描仪处理文稿的最重要软件。随着OCR光学字符识别技术的发展,扫描仪在汉字录入领域越来越受到重视。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动转化成汉字文本文  相似文献   

12.
脱机手写体汉字识别是当前OCR技术研究的热点之一.本文提出了一种用于手写体汉字识别的多特征多分类器集成的系统模型,并利用Matlab工具箱对50个汉字5000个样本进行了初步仿真实验,实验表明该模型是十分可行和有效的.  相似文献   

13.
近期,汉王通过自主创新,推出了针对教育行业的一款内嵌OCR公式识别技术的升级版文本王——助教先锋,此款产品不仅具有很高的识别率,还能快速识别公式,轻松解决了用复杂公式录入的繁琐问题。OCR作为汉王科技的核心技术之一,十余年来不断进行技术创新,在金融、税务、交通等多个行业应用,使得汉王已经成为了名副其实的“汉字识别之王”。如今,公式识别成功开发,也让汉王成为全球唯一一家可识别公式的OCR软件厂家。从全局上看,汉王OCR公式识别技术对整个OCR产业发展的作用是不可低估的,它将引领全球OCR的发展和更广泛的应用,而拥有公式…  相似文献   

14.
我国汉字OCR(Optical CharacterRecognition)技术的研究是在七十年代末开展起来的,到1986年方有成型软件出台。虽然从时间表上看与国外软件相比国内落后不少(第一个英文OCR软件ERA系统于1957年诞生,基于窥视孔方法实现,识别速度为每秒120个英文字母),但“十年磨一剑”,也算得上是硕果累累。然而令人遗憾的是,虽然普及版的OCR软件随各种扫描仪漫步天下,专业版的OCR软件却连续三年保持着5000余套的销售水平,显然不足以养活一个健康的产业。与1998年扫描仪18万台的年销量(CCID数据)和1999年有望达到35万台年销量的前景(清华紫光裴嵩市场预测)相比,这个市场容量充分表明OCR软件确实存在着一些发展策略上的问题。  相似文献   

15.
在中文输入过程中,有时需要输入一些单纯汉字偏旁,如“阝”、“艹”、“忄”等,有一次有一个朋友就问过我,我当时一愣,因为在我从事电脑这一工作以来,还未遇到过需要输入这样的汉字,但这次真的遇上了,怎么办?我想我们的中文Windows系统输入法中肯定会想到这一需求的,于是我开始研究这些汉字偏旁怎样输入,后来终于发现在Windows系统的汉字输入法中有一个“全拼”输入法,只要切换到“全拼”输入状态下,再输入“PIANPANG”,就会出现43个比较常用的偏旁部首,这样就可以解决输入单纯的汉字偏旁了,你学会了吗?用“PIANPANG”输入偏旁@翁元…  相似文献   

16.
余一骄  刘芹 《计算机科学》2015,42(2):217-223
大型中文语料库的检索需求与通用文本检索系统差异很大,需要研究专门的中文语料库检索技术。Cici是一个面向GB规模的中文语料检索系统,它高效地实现了4种针对汉语研究的检索功能,涉及词性的检索、词或短语的重叠式检索、带通配符的汉字串检索、汉字串频次检索。实现以上检索功能的关键是:先统计语料库的N-gram汉字串频次,并将统计结果分别按频次大小及汉字串Unicode编码进行倒排序索引。对用户输入的检索请求,先检索汉字串频次统计结果,向用户反馈一个备选汉字串集合;然后让用户参与检索优化过程,选择正确性较高的汉字串;最后在语料库中检索用户选定的检索词。  相似文献   

17.
图像扫描仪于80年代中期才在国外出现。近年来随着计算机图像技术的广泛应用,扫描仪这个光、机、电一体化的新生宠儿在国内也得到了迅猛的发展,在图像处理、图文排版、图文档案管理、广告制作、汉字识别输入等诸多领域内担当起越来越重要的角色。清华大学紫光扫描仪中心是目前国内最大的扫描仪生产商和销售商。她不仅有自己品牌的Uniscan系列扫描仪,还有与之配套的OCR印刷体汉字识别软件。本次我们测试的是紫光扫描仪系列产品中的入门级产品Uniscan 4A。  相似文献   

18.
不可轻视中文输入 输入看起来不算什么,但问题却十分严重,中国的用户在输入方面浪费了大量时间。中国人用五笔字型1分钟打80个汉字,美国人1分钟打80个英文单词,但这是不可比的。英文单词是比较大的单元,汉字是比较小的单元。如果把英文的单词和汉字比较,一个英文单词大约等于1.6个汉字,所以要除以1.6。除完之后,就会发现如果要跟英文比的话,拼音等于1分钟输入了13个英文单词,五笔字型是50个英文单词,手写是13个英  相似文献   

19.
如果有人问电脑在中国普及的最大障碍是什么,可能百分之五十以上的人会说是中文的输入太难。的确,西方人发明的计算机并没有为输入中文进行什么考虑,但随着技术的进步,用计算机来处理中文早已不再是什么梦想了。从国内的第一台计算机问世开始,如何处理中文、如何更方便地让用户在计算机上使用中文,便成了国内计算机研究的重中之重,但真正的汉字处理善及还是在  相似文献   

20.
中文信息技术按其发展过程, 可以划分为汉字字符处理、语词处理、语句处理和文脉处理四个阶段。研究会成立五年来, 通过全国性、跨行业、跨部门的学术交流活动, 有力地促进了中文处理技术发展。现在, 我国的中文信息技术已从汉字字符处理阶段, 进入语词和语句处理阶段。今后, 中文信息技术将与人工智能研究紧密结合, 朝向自然语言处理的广泛领域迅速发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号