首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文首先提出了整页文本数据集的合成方法。其次使用合成数据分析近几年4种整页文本识别算法的特点以及优劣,最后在这些模型的基础上,对识别错误率较高的模型,使用不同特征提取网络在测试集进行实验以提升准确率。实验分析了4种整页文本识别模型在藏文敦煌体识别任务上的性能,经过微调后准确率均达到了90%以上。  相似文献   

2.
针对计算机识别旋转多字体文字困难问题,提出基于特征空间法的文字识别方法.首先,提取文字特征,建立文字的特征空间,确定文字的运动轨迹;其次,通过空间距离比较待测文字特征与轨迹的相似度,识别出文字及其对应的旋转角度.最后,分别以单一字体旋转字符以及四种字体字符为例分别进行了实验,发现62个字符中54个字符识别率达100%,旋转角度精度在10o以内的字符达94%.实验表明该方法具有较高识别率.  相似文献   

3.
针对车辆出入库管理中存在的问题,提出了基于ARM嵌入式平台的车牌识别系统的设计和实现方案,论述了从车辆图像抓取、图像预处理、车牌区域识别、文字分割、文字识别等过程中所涉及的理论和技术问题,提出了基于POSIX规范多进程技术进行系统整合的方案。  相似文献   

4.
5.
汉王公司前身——中科院自动化研究所文字识别工程中心从八十年代以来,依靠国家863计划、国家自然科学基金项目的支持,在中科院院士戴汝为指导下,经过中心主任、研究员刘迎建同志和中心科技人员的共同努力,在文字识别的技术开发、产品转化领域走出了一条成功之路。为适应市场经济条件下科研成果转化为现实产品的时代要求,1993年3月北京中自汉王科技公司应运而生,五年来相继成功开发了联机手写汉字识别、汉王听写输入、汉王读写听、汉王全能阅读器OCR、汉王触摸屏、日、韩文手写识别软件等系统。  相似文献   

6.
端到端语音识别模型由于结构简单且容易训练,已成为目前最流行的语音识别模型。然而端到端语音识别模型通常需要大量的语音-文本对进行训练,才能取得较好的识别性能。而在实际应用中收集大量配对数据既费力又昂贵,因此其无法在实际应用中被广泛使用。本文提出一种将RNN-T(Recurrent Neural Network Transducer,RNN-T)模型与BERT(Bidirectional Encoder Representations from Transformers,BERT)模型进行结合的方法来解决上述问题,其通过用BERT模型替换RNN-T中的预测网络部分,并对整个网络进行微调,从而使RNN-T模型能有效利用BERT模型中的语言学知识,进而提高模型的识别性能。在中文普通话数据集AISHELL-1上的实验结果表明,采用所提出的方法训练后的模型与基线模型相比能获得更好的识别结果。  相似文献   

7.
文章针对大样本休的手与体汉字数据,指出了改进SDM模型的必要性,提出了两点改进措施,并在此基础上采用面向对象的程序设计方法,构造了一个手写体汉字联想记忆系统。实验表明:该系统具有较好的联想记忆性能。  相似文献   

8.
针对任意形状的场景文本检测与识别,提出一种新的端到端场景文本检测与识别算法。首先,引入了文本感知模块基于分割思想的检测分支从卷积网络提取的视觉特征中完成场景文本的检测;然后,由基于Transformer视觉模块和Transformer语言模块组成的识别分支对检测结果进行文本特征的编码;最后,由识别分支中的融合门融合编码的文本特征,输出场景文本。在Total-Text、ICDAR2013和ICDAR2015基准数据集上进行的实验结果表明,所提算法在召回率、准确率和F值上均表现出了优秀的性能,且时间效率具有一定的优势。  相似文献   

9.
本文提出了一个针对电商平台低质量图片进行文字分割的算法.汉字的主流识别方法主要为特征识别,结合置信度的词语句子识别和字库匹配识别.本文采用卷积神经网络进行识别单字,使用tesseract识别句子,结合两者修正字符,同时利用识别出的字符,对文字分割进行辅助分割,从而达到了极高的文字定位率.  相似文献   

10.
BS05和MRH是日本Murata公司生产的两种系列磁性墨水文字图形识别传感器.  相似文献   

11.
12.
在国家863计划、国家自然科学基 金的重点支持下,中国科学院自 动化文字识别实验室通过多年的努力,在文字识别研究方面取得突破性研究成果,在国内率先推出第一个成熟的汉王手稿扫描识别软件。同时推出的还有汉王联机手写汉字识别软件8.0版,汉王小秀才型简易输入识别系统,汉王全能自动阅读器OCR3.1,高速、高识别率日文印刷体识别系统,日、韩文手写识别系统,多体印刷本中英文识别系统,汉王听写系统,汉王读写听、汉王触摸屏等。这些产品的开发并推向市场,全面解决了办公自动化中文字自动输入问题,为我国的中文信息产业做出了贡献。  相似文献   

13.
识别联机手写体汉字的多级分类方法   总被引:2,自引:0,他引:2  
本文提出了一种基于笔划的联机手写体汉字多级识别方法,包括拐折码笔划识别方法和笔划位置的模糊匹配方法,拐折码法具有笔划识别率高,对笔划变形的容忍度大,计算简单等特点,笔划位置匹配法不要求笔顺,对书写者的限制比较少,本方法对国标二级汉字的识别率为95%,不要求笔顺,识别速度达到实时要求。  相似文献   

14.
15.
针对基于字符分割的中文手写识别方法存在字符分割准确率影响识别准确率和速度的问题,文中设计了一种基于卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)的中文手写识别方法,方法将特征提取、序列预测、序列对齐算法集成到同一网络,实现端到端(End-to-End)的训练和识别。模型仅需输入待识别中文手写图像,中文字符免分割,即可输出识别结果,识别的准确率(Accuracy)相较基于结构特征点字符分割识别算法提高了2. 29%,同时少了识别的时间。  相似文献   

16.
发展中的文字识别理论与技术   总被引:11,自引:2,他引:9  
郭军  马跃 《电子学报》1995,23(10):184-187
文字识别的理论与技术在强大社会需求的推动下发展,以功能实现为目标的理论已初步形成,技术成果已开始走向实用,尽管理论和技术仍不太成熟,但无论是脑机能研究的进展还是计算机性能的提高都会不断促进文字识别理论与技术的发展并最终达到理想目标。  相似文献   

17.
《现代电子技术》2019,(24):84-87
针对传统的图像识别方法在喷码字符日期码识别中速度较慢的问题,文中使用TensorFlow平台,搭建一个卷积神经网络模型,实现端到端的喷码字符日期码识别。首先,对采集到的图像进行预处理,然后通过检测轮廓的方法提取图像中的喷码字符日期区域并进行尺寸归一化处理,再用训练好的卷积神经网络模型对图像进行端到端的识别。实验结果表明,此模型识别一张图像的平均时间为25 ms,对测试集的365张图像进行识别的准确率在99%以上。  相似文献   

18.
语音识别技术已经成为信息技术中人机交互的关键技术,目前已经进入家电、汽车电子、消费电子产品等各个领域。本文简单介绍了语音识别技术的基本原理以及目前应用最广泛的两种端到端语音识别架构。  相似文献   

19.
赵泽宇  张卫强  刘加 《信号处理》2020,36(6):839-851
传统的关键词搜索(KWS, Keyword Search)系统依靠自动语音识别(ASR, Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E, End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV, Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。   相似文献   

20.
针对现有盲文书籍少且价格昂贵,而常人阅读的纸质书籍多,但缺乏盲人阅读设备的问题,设计了基于安卓(Android)的盲用手机阅读器。该阅读器集成语音合成、语音识别、光学字符识别(OCR)等人工智能技术,可将纸质读物转换为盲文,也可直接获取有声书播放,同时还可配合特定的盲文点显器将文本或音频转换为盲文。该阅读器安装简单、操作简便,解决了盲人获取书籍信息困难的问题,为盲人获取海量的纸质书籍和有声书提供了方便。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号