首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
图像和视频中的文字获取技术   总被引:6,自引:0,他引:6       下载免费PDF全文
许多图像都包含丰富的文字信息,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别,对图像高层语义内容的自动理解、索引和检索非常有价值,因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解,并使该领域研究人员有所借鉴,在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上,综述了该领域的发展现状,同时从文字检测、抽取和文字识别两个方面,重点讨论了其主要的技术方法及应用优缺点,并结合当前面临的问题,指出今后可进一步研究的方向。  相似文献   

2.
在设计广告招贴画、图书封面、唱片封面时,为了增强画面视觉效果和凸出主题,经常需要对广告词、书名等文字进行特效处理,经过特别处理的文字被称为特效文字。Photoshop的路径可以说是创建特效文字最灵活、最精确的方法之一,通过设定的工具沿路径进行描绘,可勾画出一些在选择区域中无法实现的特殊效果。下面分别举例说明:犤实例一犦制作彩色牙膏文字,如图1-1所示。图1-1操作步骤:1.新建一个文件:640×480像素,72像素/英寸,RGB模式,白色背景。图1-2图1-3巧用Photoshop的路径制作特效文字@周利民!湖南…  相似文献   

3.
上网冲浪时,当你看到一篇喜欢的文章或者重要的新闻,你会怎么处理呢?是把整个网页“另存为”,还是把需要的文字复制下来另外存档?其实这些方法不仅麻烦,保存的文件管理起来也极为不便。因此,为了让上述工作处理得方便快捷、事半功倍,你就必须借助Cogitum Co-Citer了。 Cogitum Co-Citer的主要功能是收集捕捉网页上的文  相似文献   

4.
一种基于Delaunay三角化的手写体文字细化方法   总被引:7,自引:0,他引:7       下载免费PDF全文
为了对手写体文字进行快速准确的识别,基于Delaunay三角化方法,提出了一种新的文字图象细化算法,该算法首先通过对文字图象边界的近似多边形进行Delaunay三角化,同时把其分成一系列保持拓扑关系的三角形,然后根据三角形的类型生成不同的局部骨架;最后连接生成整文字图象的骨架,由于该算法充分利用了图象的全局和局部信息,因此具有速度快,效果好等优点。  相似文献   

5.
郭欣 《软件导刊》2003,(6):88-90
QQ的最新版本已经象ICQ那样支持了文字的一些多媒体效果,例如我们可以在QQ上改变文字太小、样式,颜色,还可以加入一些QQ附带的卡通图片,来增添我们的聊天气氛;但是有些朋友们不满足这些简单的多媒体效果.连想玩一些更炫的花样.表现一下自己的个性,那么请跟我来,下面一些实例将告诉你如何QQ用发送超大文字、竖排文字.彩色文字,以及一些趣闻图片;你一定会说,这些东西我也会啊!不就是使用QQ的那些按钮功能吗?这里说的可不一样,在QQ0630以上版本中,支持了代码输入功能,让我们体会到了前所未有的神秘功能,先看了再说吧!  相似文献   

6.
本文讨论的是一种单片机控制的通用文字/语音综合报警系统。探讨了系统的结构组成、使单片机数据存储器寻址范围远超出64KB的分段管理技术及人机接口。还讨论了语音芯片与单片机的接口以及发光二极管点阵用于汉字显示的驱动与接口电路。并对系统的软件设计和单片机内部资源的配置也作了详细的说明。  相似文献   

7.
基于贝叶斯分类器的混排文字切分与分类   总被引:2,自引:1,他引:2  
该文针对实际的混排文档图像,提出一种基于贝叶斯分类器的统计学习方法切分文字,并实现文字类别判断。该方法结构简单、计算量少、易于扩展功能,而且试验结果表明该方法切分效果好、文字类别判断准确。  相似文献   

8.
该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字重构时存在歧义性的必要条件和充分条件,并分析了线性化文字序列歧义度的本质和歧义性发生的概率;最后,讨论了文字重构歧义性消除的方案,给出了基于基本字母的在线式朝鲜文字序列输入算法和核心步骤,通过仿真实验验证了该方案的可靠性和有效性。  相似文献   

9.
为了提高经典目标检测算法对自然场景文本定位的准确性,以及克服传统字符检测模型由于笔画间存在非连通性引起的汉字错误分割问题,提出了一种直接高效的自然场景汉字逼近定位方法。采用经典的EAST算法对场景图像中的文字进行检测。对初检的文字框进行调整使其更紧凑和更完整地包含文字,主要由提取各连通笔画成分、汉字分割和文字形状逼近三部分组成。矫正文字区域和识别文字内容。实验结果表明,提出的算法在保持平均帧率为3.1 帧/s的同时,对ICDAR2015、ICDAR2017-MLT和MSRA-TD500三个多方向数据集上文本定位任务中的F-score分别达到83.5%、72.8%和81.1%;消融实验验证了算法中各模块的有效性。在ICDAR2015数据集上的检测和识别综合评估任务中的性能也验证了该方法相比一些最新方法取得了更好的性能。  相似文献   

10.
文字复制无非是Ctrl+C与Ctrl+V的组合。在很多人看来是再简单不过的一项操作。但如果有人要从图片,你也许会觉得匿夷所思吧。虽然常规方法无法解决,但我们可以别辟蹊径,在本文中,我们就将挑战这些看似无法实现的文字抓取任务![编者按]  相似文献   

11.
看看左图中的“流动”这两个字是不是像流水一样从中心蜿蜒流出呢?我是在同学的主页上看到这种效果图的,当时羡慕得不得了。回来后自己琢磨了好几天,又请教同学,终于做成了这样的效果图。其实,很简单,只要你有Photoshop 6.0,我保管你看完这篇文章就能做出来。  相似文献   

12.
近年来,数字图像的数量急剧上涨。通常数字图像中所包含的文字信息对于图片内容的理解、索引和检索具有重要意义。该文介绍了计算机对图像中文字自动识别和提取的主要步骤和技术难点;并提出了在静态图像文字提取技术中的几个设想。  相似文献   

13.
一种自适应的视频帧中字幕检测定位方法   总被引:3,自引:0,他引:3  
王勇  燕继坤  郑辉 《计算机应用》2004,24(1):134-135,139
视频帧中的字幕往往包含当前视频的高层语意内容,对视频内容的自动理解、索引和检索有重要意义。文中提出了一种视频帧中字幕的自适应检测定位方法,与以往根据经验设定阈值的方法相比,该方法简单,对视频帧的复杂变化的适应能力更强,检测定位更快速、准确。大量实验结果显示该方法是有效的。  相似文献   

14.
15.
自然场景文本检测对于机器理解场景等有着重要作用。近年来,随着深度学习的发展,自然场景文字检测方法也日新月异,取得了很好的检测效果。分析、总结了近年来基于深度学习的场景文字检测方法,将其归纳分类为基于回归、基于分割,以及两者混合三种类型,并对各类检测方法的优缺点进行了对比分析。介绍了场景文本检测性能指标及常用的公开数据集以及下载方式。对场景文字检测领域研究进行总结和展望,有望为深度学习场景文本检测方法提供新的研究方向。  相似文献   

16.
一种身份证图像自动识别中文字定位与分割的方法   总被引:4,自引:1,他引:4  
针对扫描后的身份证图像存在纹理及背景等强烈干扰,详细探讨了利用数字图像处理技术对身份证上的文字信息进行定位与分割的一种方法。该方法通过对身份证的特征的研究,利用水平投影与垂直投影相结合的方法,首先确定出文字的大致区域,然后利用模板框准确的定位出文字的位置。实例表明所提出的方法行之有效。  相似文献   

17.
人工智能的出现为人们的生活和生产方式带来了巨大的改变,加之科技和网络技术的发展,人们已经成功地步入到了信息时代,在人们生活中的各个方面都离不开信息技术.人工智能机器在众多的智能化产物中由于自身具备的独特特点得到了人们的关注,这也是自动驾驶技术中不可或缺的关键技术,对其进行研究具有显著的现实意义.基于此种发展背景,从文字识别角度出发,对人工智能机器学习中文字识别发展的背景和主要方法进行分析,旨在促进其发展过程中问题的解决.  相似文献   

18.
19.
1.关于图形→变换→再次变换命令正确的是()A)“再次变换命令”可以完成物体的多次固定距离的移动及复制B)“再次变换命令”可以完成物体的多次固定数值的旋转及复制C)“再次变换命令”可以完成物体的多次固定数值的倾斜及复制D)“再次变换命令”可以完成物体的多次固定数值的涡形旋转及复制答案:D)分析:“再次变换”主要用于对上一次编辑(变换)后的图形再次使用同一种效果。“变换”只能来自“变形”下的“移动”、“缩放”、“旋转”、“镜像”和“倾斜”命令。2.在Illustrator中有几个选择工具()A)1B)2C)3D)5答案:D)分析:在…  相似文献   

20.
开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务。该任务要求,算法在测试(推断)阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时,针对开放集文字识别三大问题(未知样本发现、新类别识别和上下文信息偏差),从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号