首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
学校最近搞宣传,需要做很多材料,而许多文字需要从图片、PDF文档甚至视频中获得,有的还是英文资料,现在要把它们提取出来,变成可编辑的中文。通常找一款文字识别软件、一款PDF转TXT软件、一款翻译软件也能完成,视频中的文字再手工输入,但这需要安装多款软件。而“超级图像文本转换软件”(下载地址:http://u.115.com/file/aq2mcn6d)可以完成上述所有工作,虽然软件个头较大,达144MB,但不必安装,功能齐全,是其他软件不能比的。  相似文献   

2.
大家平常扫描识别一些文字资料的时候,通常会用到OCR文字识别软件,不过有时候手头没有这类软件或者懒得安装,这就需要笔者推荐的在线OCR网站来帮忙了。在线OCR识别网站(httP://www.netocr.net)应用了清华大学研制的国际领先OCR识别技术,支持TIF、BMP.JPG等多种常见图像格式,能识别出纯英文,简繁体中文,日文、韩文以及手写体和中英文混排的文本图像。通过它,可以从此告别OCR软件,随时随地轻松搞定文字识别。  相似文献   

3.
提出了从复杂背景视频图像中提取文字并识别的一套算法,利用自适应迭代算法提取视频中维吾尔文字,针对维吾尔文字的一些特点,利用合适的预处理方法保留维吾尔文字中的各种点及特殊笔画,同时有效地消除了复杂背景带来的噪声。考虑维吾尔文字书写的特点,利用滑动窗口法提取文字特征避免了文字分割,将产生的特征向量输入到隐马尔可夫模型(Hidden Morkov Model)中进行训练和识别。  相似文献   

4.
冯小民 《电脑迷》2009,(24):65-65
要将窗口中的某些文字(比如按钮文字,或者软件窗口中的提示类文字)快速复制下来,使用常规的方法显然行不通——因为文字不能被选中。你可能会想到通过抓图的方法抓取这些文字保存为TIF格式图片文件,再用Office软件中的“Microsoft Office Document Imaging”程序来进行OCR识别以得到文本。实际上,  相似文献   

5.
目的 图像修复是根据图像中已知内容来自动恢复丢失内容的过程。目前基于深度学习的图像修复模型在自然图像和人脸图像修复上取得了一定效果,但是鲜有对文本图像修复的研究,其中保证结构连贯和纹理一致的方法也没有关注文字本身的修复。针对这一问题,提出了一种结构先验指导的文本图像修复模型。方法 首先以Transformer为基础,构建一个结构先验重建网络,捕捉全局依赖关系重建文本骨架和边缘结构先验图像,然后提出一种新的静态到动态残差模块(static-to-dynamic residual block,StDRB),将静态特征转换到动态文本图像序列特征,并将其融合到编码器—解码器结构的修复网络中,在结构先验指导和梯度先验损失等联合损失的监督下,使修复后的文本笔划连贯,内容真实自然,达到有利于下游文本检测和识别任务的目的。结果 实验在藏文和英文两种语言的合成数据集上,与4种图像修复模型进行了比较。结果表明,本文模型在主观视觉感受上达到了较好的效果,在藏文和英文数据集上的峰值信噪比和结构相似度分别达到了42.31 dB,98.10%和39.23 dB,98.55%,使用Tesseract OCR (optical character recognition)识别修复后藏文图像中的文字的准确率达到了62.83%,使用Tesseract OCR、CRNN (convolutional recurrent neural network)以及ASTER (attentional scene text recognizer)识别修复后英文图像中的文字的准确率分别达到了85.13%,86.04%和76.71%,均优于对比模型。结论 本文提出的文本图像修复模型借鉴了图像修复方法的思想,利用文本图像中文字本身的特性,取得了更加准确的文本图像修复结果。  相似文献   

6.
基于SPEECH SDK的中文学习系统   总被引:1,自引:0,他引:1  
介绍了Microsoft Speech SDK的功能以及相关的一系列API函数,分别利用其语音识别(Speech Recognition)引擎和语音合成(Textto Speech)引擎实现英文语音识别和中文文本语音合成功能,采用Access 2003数据库的查询操作完成翻译功能,进而实现整个英文到中文的学习系统,该系统具有很高的商业价值。  相似文献   

7.
张显杰  张之明 《计算机应用》2022,42(8):2394-2400
手写体文本识别技术可以将手写文档转录成可编辑的数字文档。但由于手写的书写风格迥异、文档结构千变万化和字符分割识别精度不高等问题,基于神经网络的手写体英文文本识别仍面临着许多挑战。针对上述问题,提出基于卷积神经网络(CNN)和Transformer的手写体英文文本识别模型。首先利用CNN从输入图像中提取特征,而后将特征输入到Transformer编码器中得到特征序列每一帧的预测,最后经过链接时序分类(CTC)解码器获得最终的预测结果。在公开的IAM(Institut für Angewandte Mathematik)手写体英文单词数据集上进行了大量的实验结果表明,该模型获得了3.60%的字符错误率(CER)和12.70%的单词错误率(WER),验证了所提模型的可行性。  相似文献   

8.
文本图像识别是计算机视觉领域一项重要任务,而其中的中文识别因种类繁多、结构复杂以及类间相近等特点很具挑战性.为改善这一问题,使用文本行端到端的识别模型.首次提出利用密集卷积神经网络(DenseNet)提取文本图像底层特征,同时避免手工设计、统计图像特征的繁琐;将整行图像特征直接送入双向长短时记忆模型(BLSTM)进行局部相关性分析,减少字符定位分割这一步骤;最后采用时域连接模型(CTC)解码获得识别的文本信息.实验表明所提出的模型可以高效的进行图像文本行的识别,并对图像的多种形变具有较好的鲁棒性.  相似文献   

9.
移动串串烧     
《电脑爱好者》2012,(15):37-37
搜搜借你一双慧眼 手机翻译软件和扫描软件大家可能都用过,如果把这两个软件结合在一起会是什么样子呢?最近腾讯针对手机推出了一款识别软件——SOSO慧眼,它不仅可以对摄像头拍下的文字进行识别,而且还具备两大功能,一个是识别英文,进行中译英和英译中的翻译;  相似文献   

10.
文本检测是文本识别的前提和基础。复杂自然场景下,受透视、遮挡、变形等因素影响,图像质量难以保证,同时图像中的文字形式丰富多样,多呈不规则形状,加上复杂背景的干扰,致使文本检测难度大、精确度低。针对文本形状不规则的场景,提出了一种文本边轨模型(TextRail),该模型基于文本上、下边界基准点表示文本区域的思想,实现对任意形状文本的高效检测。TextRail使用全卷积网络(full convolutional network,FCN)及特征金字塔网络(feature pyramid network,FPN)提取文本图像特征;将特征送入检测头网络,实现文本区域上下边界基准点的预测,将预测结果通过位置感知非极大抑制(locality-aware non-maximum suppression,LNMS)合并,得到最终的上下边界基准点;采用薄板样条插值(thin plate spline,TPS)的方法实现对不规则文本的自动矫正。通过大量的实验验证,TextRail在F1分值上优于其他文本检测模型。同时TextRail模型可以准确表示出文字的朝向、弯曲和变形情况,有效提升了不规则文本检测的准确...  相似文献   

11.
基于文本区域特征的图像型垃圾邮件过滤算法   总被引:4,自引:0,他引:4  
垃圾邮件图像中通常含有大量文本区域,且这些区域常含有较多区分能力强的特征。提出一种基于图像中文本区域特征的垃圾邮件图像识别算法。首先提取出图像中文本区域的特征,包括:文本区域数量和面积、色饱和度、文字数量和颜色数量,以及图像的一些属性特征如图像面积等;然后利用支持向量机分类算法来识别垃圾邮件图像。实验表明,对于真实的邮件图像集,算法能够识别出98.5%的垃圾邮件图像,且正确率超过98%。  相似文献   

12.
文字识别是深度学习网络的重要应用领域,主流算法基于光学信息预测自然场景文字。然而在一些特定领域的文本对象上,额外的关键特征将会进一步提高文字识别算法的准确性。在安防监控领域,画面中的时间戳文本拥有格式规范、限定数值范围等特点,根据这一特点,对时间戳文本识别网络进行了研究,提出一种时间戳信息约束机制,融合文本语义约束信息和光学特征达到识别规范文本的效果,增强输出时间戳文本的格式规范性和数值合理性。在全匹配率、编辑距离等标准上全面超过基于光学特征的经典文字识别算法。  相似文献   

13.
针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型得到原始医学文本的向量表示,再利用双向门控循环神经网络(BiGRU)获取字粒度的特征向量。结合医疗领域命名实体鲜明的部首特征,利用迭代膨胀卷积神经网络(IDCNN)提取部首级别的特征向量。使用协同注意力网络(co-attention network)整合特征向量,生成<文字-部首>对的双相关特征,再利用条件随机场(CRF)输出实体识别结果。实验结果表明,在CCKS数据集上,相较于其他的实体识别模型能取得更高的准确率、召回率和F1值,同时虽然增加了识别模型的复杂程度,但性能并没有明显的降低。  相似文献   

14.
针对背景复杂或者存在字符黏连时文本段图片无法准确切分的情况进行了研究,提出了一种复杂场景文本段识别方法。该方法利用图像和文字序列的相关性设计双向递归神经网络对图像特征序列进行编码,然后设计集成的连接时间分类(CTC)和注意力(attention)模块对编码特征进行解码输出。该算法在多个数据集(公开数据集ICDAR2013和ICDAR2003以及验证码数据集)上进行测试,得到识别准确率分别为90.2%、87.4%和92.5%,从而证明了该算法的有效性。实验结果对文本段识别和应用有重要意义。  相似文献   

15.
针对基于视频的连续手语识别的文本结果存在语义模糊、语序混乱的问题,提出一种两步法将连续手语识别结果的手语文本转化为通顺、可懂的汉语文本。第一步,基于自然手语规则以及N元语言模型(N-gram)对连续手语识别的结果进行文本调序;第二步,利用汉语通用量词数据集训练双向长短期记忆(Bi-LSTM)网络模型,以解决手语语法无量词的问题,从而提升语句通顺度。使用绝对准确率和最长正确子序列占比作为文本调序的评价指标,实验结果显示,所提方法的文本调序结果绝对准确率为77.06%,最长正确子序列占比为86.55%,量词补全准确率为97.23%。所提的方法能够有效提升连续手语识别的文本结果的通畅度和可懂度,已成功应用于基于视频的连续手语识别,提升了听障人和健听人的无障碍交流体验。  相似文献   

16.
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。  相似文献   

17.
介绍一种基于开源计算机视觉库(OpenCV)、训练模型(Seq2Seq)及Python语言实现的实时图像文字翻译技术。先使用OpenCV对摄像头画面进行捕获,再进行预处理、腐蚀、降噪、文字处理识别,代入Seq2Seq模型中,实现中英文字的翻译。  相似文献   

18.
从复杂的自然场景标志牌图像中提取和识别字符一直是数字图像处理领域的热点问题,目前的求解算法普遍存在提取文本精确度不高,提取率偏低,鲁棒性差等缺点。提出一种高效的文本提取算法,针对标志牌文本图像通常具有较复杂的自然背景等特征,首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取,再对边缘图像进行非文本长边缘的删除,最后根据文本区域的特征进行边缘扫描和连通域分析实现标志牌文本的提取。通过对2003年国际自然场景文本识别竞赛(ICDAR’2003 Robust Reading Competition)中大量图片测试表明,该算法对背景的复杂度、文字语言、颜色、大小字体以及排列方向具有较强的鲁棒性,同时也具有较高的准确率(Precision)和提取率(Recall)。  相似文献   

19.
SDL是一种主要用于对电信系统性能制定确切的功能规格和描述的国际标准语言.本文描述了以CCITTSDL’88为标准,基于图形核心系统(GKS)设计实现的SDL支撑系统(3S),包括SDL的图形方式(SDL/GR)的文档录入和编辑工作、对录入的SDL/GR文档进行正确性检查和将SDL/GR文本翻译到文字短语方式表达的SDL/PR文本等几部分.此工作的完成对于使用图形方式描述计算机系统,然后翻译到高级语言提供了可能.  相似文献   

20.
孟曌  田生伟  禹龙  王瑞锦 《计算机应用》2019,39(8):2450-2455
为提高对文本语境深层次信息的利用效率,提出了联合分层注意力网络(HAN)和独立循环神经网络(IndRNN)的地域欺凌文本识别模型——HACBI。首先,将手工标注的地域欺凌文本通过词嵌入技术映射到低维向量空间中;其次,借助卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取地域欺凌文本的局部及全局语义特征,并进一步利用HAN捕获文本的内部结构信息;最后,为避免文本层次结构信息丢失和解决梯度消失等问题,引入IndRNN以增强模型的描述能力,并实现信息流的整合。实验结果表明,该模型的准确率(Acc)、精确率(P)、召回率(R)、F1和AUC值分别为99.57%、98.54%、99.02%、98.78%和99.35%,相比支持向量机(SVM)、CNN等文本分类模型有显著提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号