首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 672 毫秒
1.
刘尚旺  张新明  张非 《计算机应用》2022,42(7):2227-2238
在当今国际化的社会,作为国际通用语言的英文字符及中文环境下的拼音字符出现在众多公共场合。当这些字符出现在图像中时,尤其在风格复杂的图像中时,难以直接对其进行编辑修改。针对上述问题,提出了一种改进文字生成网络(FANnet)的图像字符编辑方法。首先,利用基于直方图对比度(HC)的显著性检测算法改进自适应字符检测(CAD)模型,准确提取出用户所选择的图像字符;接着,根据FANnet,生成与源字符字体几乎一致的目标字符的二值图;然后,通过所提出的局部颜色分布(CDL)迁移模型,迁移源字符颜色至目标字符;最后,生成与源字符字体结构和颜色变化均高度一致的目标可编辑修改字符,从而达到字符编辑目的。实验结果表明,在MSRA-TD500、COCO-Text和ICDAR数据集上,所提方法的结构相似性(SSIM)、峰值信噪比(PSNR)和归一化均方根误差(NRMSE)平均值分别为0.776 5、18.321 1 dB和0.435 8,相较于基于字体自适应神经网络的场景文本编辑器(STEFANN)算法分别提高了18.59%、14.02%和降低了2.97%,相较于多模态小样本字体迁移模型MC-GAN算法(输入1个字符时)分别提高了30.24%、23.92%和降低了4.68%;而且针对字体结构和颜色渐变分布比较复杂的实际场景图像字符,所提方法的编辑效果也较好。该方法可以应用于图像重利用、图像字符计算机自动纠错和图像文本信息重存储。  相似文献   

2.
基于笔划特征的单字符汉字字体识别   总被引:1,自引:0,他引:1  
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.有别于目前基于多个字符组成的文本块的字体识别方法,本文提出了一种基于单个汉字字符的字体识别方法.在单个汉字字符上提取两类特征:笔划属性特征和笔划分布特征,分别构成两个分类器对单个汉字字符进行字体识别,并集成两个分类器的结果得到最终的识别结果.我们使用的笔划属性特征分类器是文本无关的,而笔划分布特征分类器是文本相关的,集成的分类器属于文本相关的字体识别分类器.我们在包含7种字体的样本集上进行了测试,测试结果显示基于单字的字体识别率达到94.48%.  相似文献   

3.
针对文字图像中不规则干扰与文字粘连导致误识字的问题,提出了基于部分卷积的文字图像不规则干扰修复算法。研究分析了若干常见字体的文本图像特点,建立文字图像数据库,使其与干扰掩码数据库进行图像融合后对模型的修复效果进行评测,并对不同等级的修复情况进行分类测试。实验表明,所提模型在保证原有文字信息不损失的前提下,根据当前文字的现有部件对缺失部分进行预测,峰值信噪比最高达到32.46 dB,结构相似性最高为0.954,最佳损失值达到0.015,修复前后文字识别率提升2785%,对隶书、篆书、甲骨文、行书4种古代文字缺损图像进行修复后峰值信噪比最高达到30.46 dB,结构相似性最高为0.964。  相似文献   

4.
王寅同  郑豪  常合友  李朔 《控制与决策》2023,38(7):1825-1834
中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深度可分离卷积提取有意义特征,残差注意门控模块提升文本图像中的关键区域的重要性;其次,采用批量双线性插值模型对输入表征进行拉伸-挤压,实现二维文本表征到一维文本行表征的文本行上采样;最后,以连接时序分类作为识别模型的损失函数,实现高层次抽取表征与字符序列标记的对应关系.在CASIA-HWDB2.x和ICDAR2013两个数据集上进行实验研究,结果表明,所提方法在没有任何字符或文本行的位置信息时能够有效地实现端到端手写文本识别,且优于现有的方法.  相似文献   

5.
蒙古文的每个字素在词的不同位置有着不同的书写形式,使得蒙古文字形结构多样且数量庞大,从而导致利用计算机辅助和传统人工方式设计蒙古文字体需要耗费大量的人力物力。故创建一种能自动生成蒙文字体风格的模型十分必要。国内外已有学者开展了对汉字和英文字体风格自动迁移的研究,但蒙古文领域仍处于空白阶段。因此,该文提出将条件生成对抗网络模型应用于蒙古文字体风格迁移,并给出了相关模型,实现了相应的算法和软件。在蒙古文字体数据集上进行实验,模型采用生成损失和判别损失衡量模型,Adam优化器自动调整学习率,逐渐减少差异值,直到生成器和判别器达到纳什平衡状态,可直接从蒙古文标题字体生成蒙古文手写体等字体,得到的生成字体样式基本接近真实字体样式,达到字体风格迁移的效果。  相似文献   

6.
由于汉字拥有大量的字符,大多数对汉字的研究主要集中在汉字的识别和分类问题上,对于生成汉字的研究较少,尤其是在没有大量配对的汉字数据集的情况下.该模型使用内容和风格样式都不匹配的汉字数据集,将生成个性化手写汉字的过程公式化为一个从现有的标准印刷字体到个性化手写汉字样式映射的问题.在基于无监督学习的图像翻译模型的基础上,利...  相似文献   

7.
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。  相似文献   

8.
ClearType是微软在LCD显示器上增强文本分辨率的字体技术,与 Linux下的“亚像素平滑”显示技术非常类似,此技术可以让LCD显示器 的字体显示更加顺畅清晰。ClearType技术应用特有的信号处理及LCD显 示器的自身特性,通过产生清晰、细微的字符和间隔可显著增加可读性。 借助ClearType技术,英文字符的可读性最高可达300%,对中文字符的 显示也有显著提高。对于LCD、笔记本电脑、Pocket PC、PDA等设备来 说,ClearType有着广阔的应用前景。在Windows XP的“显示属性/外 观/效果(E)”中,在“使用下列方式使屏幕字体的边缘平滑(S):”选 项中选择“清晰”就可以开启这项技术(如图1)。  相似文献   

9.
李巍  梁斯昕  张建州 《计算机应用》2023,(10):3267-3274
针对目前图像缺陷检测模型对长尾缺陷数据集中尾部类检测效果较差的问题,提出一个基于梯度引导加权-延迟负梯度衰减损失(GGW-DND Loss)。首先,根据检测器分类节点的累积梯度比值分别对正负梯度重新加权,减轻尾部类分类器的受抑制状态;其次,当模型优化到一定阶段时,直接降低每个节点产生的负梯度,以增强尾部类分类器的泛化能力。实验结果表明,在自制图像缺陷数据集和NEU-DET(NEU surface defect database for Defect Detection Task)上,所提损失的尾部类平均精度均值(mAP)优于二分类交叉熵损失(BCE Loss),分别提高了32.02和7.40个百分点;与EQL v2(EQualization Loss v2)相比,分别提高了2.20和0.82个百分点,验证了所提损失能有效提升网络对尾部类的检测性能。  相似文献   

10.
受成像设备、传输条件等因素限制,遥感图像的清晰度难以保证。图像超分辨率技术旨在从低分辨率图像中恢复出高分辨率图像,对遥感图像的高质量解译具有重要意义。针对传统方法依赖多帧图像序列、重建结果过于平滑等问题,提出一种基于边界平衡生成对抗网络的单帧遥感图像超分辨方法。生成器与判别器均设计成带跳跃连接的端到端自编码器结构,为增强生成图像质量及加速网络收敛,使用了一种基于判别器重构误差的损失函数。在NWPU-RESISC45数据集上的实验结果表明,该方法能够提供更多的高频信息,重建结果最接近真实图像,相较于邻近插值和双三次插值方法,PSNR提升约2.70 dB,相较于其他基于深度卷积神经网络的方法,PSNR提升约0.72 dB。  相似文献   

11.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

12.
边缘与灰度检测相结合的场景图像文本定位   总被引:1,自引:0,他引:1       下载免费PDF全文
自然场景图像中包含大量的图像和文本信息,其文本字符能够提供重要的语义信息。利用计算机自动检测并识别自然场景中的文本信息,是模式识别和文字信息处理领域重要的研究内容。本文提出一种有效的从场景图像中定位文本的方法,其原理为:首先基于边缘检测进行文本区域粗定位,对定位到的区域进行灰度检测,来确定文本域中的字符位置,其后对所得到的检测区域进行筛选,去掉噪声区域,获取到目标文本域。实验结果表明,本文提出的方法对字体的大小、样式、颜色、以及排布方向具有较强的鲁棒性, 能够准确定位并提取自然场景下的文本信息。  相似文献   

13.
CCED 2000将艺术字编辑能力融合在普通的页面字符排版修饰中,通过对普通文字的字符修饰功能制作艺术字。这样,任何文字都可以成为艺术字,艺术字也就是普通的文字,不需要将艺术字作为图片形式插入文档。CCED 2000艺术字不能产生字体的夸张变形,但字体前景、背景的花样翻新却是WPS 2000所不及的,其普通字符修饰效果甚至不在PhotoShop等专业图像处理软件制作的艺术字之下。而且,它制作艺术字的过程很简单,仅使用一般字符修饰的方  相似文献   

14.
陈可佳  费子阳  陈景强  杨子农 《软件学报》2022,33(12):4668-4687
文本风格迁移是近年来自然语言处理领域的热点问题之一,旨在保留文本内容的基础上通过编辑或生成的方式更改文本的特定风格或属性(如情感、时态和性别等).旨在梳理已有的技术,以推进该方向的研究.首先,给出文本风格迁移问题的定义及其面临的挑战;然后,对已有方法进行分类综述,重点介绍基于无监督学习的文本风格迁移方法并将其进一步分为隐式和显式两类方法,对各类方法在实现机制、优势、局限性和性能等方面进行分析和比较;同时,还通过实验比较了几种代表性方法在风格迁移准确率、文本内容保留和困惑度等自动化评价指标上的性能;最后,对文本风格迁移研究进行总结和展望.  相似文献   

15.
目的 基于深度学习的端到端场景文本识别任务已经取得了很大的进展。然而受限于多尺度、任意形状以及背景干扰等问题,大多数端到端文本识别器依然会面临掩码提议不完整的问题,进而影响模型的文本识别结果。为了提高掩码预测的准确率,提出了一种基于软注意力的掩码嵌入模块(soft attention mask embedding,SAME),方法 利用Transformer更好的全局感受野,将高层特征进行编码并计算软注意力,然后将编码特征与预测掩码层级嵌入,生成更贴近文本边界的掩码来抑制背景噪声。基于SAME强大的文本掩码优化及细粒度文本特征提取能力,进一步提出了一个健壮的文本识别框架SAME-Net,开展无需字符级注释的端到端精准文本识别。具体来说,由于软注意力是可微的,所提出的SAME-Net可以将识别损失传播回检测分支,以通过学习注意力的权重来指导文本检测,使检测分支可以由检测和识别目标联合优化。结果 在多个文本识别公开数据集上的实验表明了所提方法的有效性。其中,SAME-Net在任意形状文本数据集Total-Text上实现了84.02%的H-mean,相比于2022年的GLASS(global to local attention for scene-text spotting),在不增加额外训练数据的情况下,全词典的识别准确率提升1.02%。所提方法在多向数据集ICDAR 2015(International Conference on Document Analysis and Recognition)也获得了与同期工作相当的性能,取得83.4%的强词典识别结果。结论 提出了一种基于SAME的端到端文本识别方法。该方法利用Transformer的全局感受野生成靠近文本边界的掩码来抑制背景噪声,提出的SAME模块可以将识别损失反向传输到检测模块,并且不需要额外的文本校正模块。通过检测和识别模块的联合优化,可以在没有字符级标注的情况下实现出色的文本定位性能。  相似文献   

16.
王强  关毅  王晓龙 《自动化学报》2007,33(8):809-816
提出一种应用文本特征的类别属性进行文本分类过程中的类别噪声裁剪 (Eliminating class noise, ECN) 的算法. 算法通过分析文本关键特征中蕴含的类别指示信息, 主动预测待分类文本可能归属的类别集, 从而减少参与决策的分类器数目, 降低分类延迟,提高分类精度. 在中、英文测试语料上的实验表明, 该算法的 F 值分别达到 0.76 与 0.93, 而且分类器运行效率也有明显提升, 整体性能较好. 进一步的实验表明,此算法的扩展性能较好, 结合一定的反馈学习策略, 分类性能可进一步提高, 其 F 值可达到 0.806 与 0.943.  相似文献   

17.
当Word或WPS 2000的公式编辑器不能满足您的需要时,不妨去下载这个“万能公式编辑器”试试!利用该公式编辑船,可以进行普通文本编辑方法不能编辑的所有公式或用符号、文字组成的图形等。用它可编辑任意学科公式(表达式),仅通过点击或拖动鼠标即可完成公式编辑。它将一个公式本身看成是一些符号的集合,只有符号类型、大小和位置三种属性,因此编辑公式只需进行:①选择或输入公式中的符号:②调整符号大小:③调整符号位置三项操作。它的界面如图所示,在公式编辑器窗口的上部,有“公式编辑板”;左上部是调整符号字体、大小和风格的框:右上部有用于调整符号位置的四个方向按钮和字符输入框。下部是提供各种符号的选项卡。编辑公式就是将公式中的字符、符号根据其大小风格不同放到合适的位置的过程。  相似文献   

18.
目的 中国书法博大精深,是中国文化很重要的组成部分。书法字体与风格分类是书法领域的研究热点。目前书法字体和书法风格两个概念混淆,并且书法风格分类准确率不高,针对上述问题,本文将两个概念进行区分,并提出了一个融合多损失的孪生卷积神经网络,能同时解决中国书法字体以及风格分类问题。方法 提出的网络包含两个共享权重的分支,每个分支用于提取输入图像的特征。为了获得不同尺度下的特征表示,将Haar小波分解嵌入到每个网络分支中。与传统孪生神经网络不同的是,将网络的每个分支扩展为一个分类网络。网络训练时融合了两类不同的损失,即对比损失和分类损失,进而从两个角度同时对网络训练进行监督。具体来说,为了使来自同一类的两幅输入图像特征之间的距离尽可能小、使来自不同类的两幅输入图像特征之间的距离尽可能大,网络采用对比损失作为损失函数。此外,为了充分利用每幅输入图像的类别信息,在网络每个分支上采用交叉熵作为分类损失。结果 实验结果表明,本文方法在两个中国书法字体数据集和两个中国书法风格数据集上的分类准确率分别达到了99.90%、94.09%、99.38%和93.28%,高于对比方法。两种损失起到了良好的互补作用,Haar小波分解的引入在4个数据集上均提升了分类准确率,在风格数据集的提升效果更为明显。结论 本文方法在中国书法字体以及风格分类两个任务中取得了令人满意的效果,为书法领域研究工作提供了新思路。  相似文献   

19.
张小川  戴旭尧  刘璐  冯天硕 《计算机应用》2020,40(12):3485-3489
针对中文短文本缺乏上下文信息导致的语义模糊从而存在的特征稀疏问题,提出了一种融合卷积神经网络和多头自注意力机制(CNN-MHA)的文本分类模型。首先,借助现有的基于Transformer的双向编码器表示(BERT)预训练语言模型以字符级向量形式来格式化表示句子层面的短文本;然后,为降低噪声,采用多头自注意力机制(MHA)学习文本序列内部的词依赖关系并生成带有全局语义信息的隐藏层向量,再将隐藏层向量输入到卷积神经网络(CNN)中,从而生成文本分类特征向量;最后,为提升分类的优化效果,将卷积层的输出与BERT模型提取的句特征进行特征融合后输入到分类器里进行再分类。将CNN-MHA模型分别与TextCNN、BERT、TextRCNN模型进行对比,实验结果表明,改进模型在搜狐新闻数据集上的F1值表现和对比模型相比分别提高了3.99%、0.76%和2.89%,验证了改进模型的有效性。  相似文献   

20.
基于笔画和Adaboost的两层视频文字定位算法   总被引:3,自引:1,他引:2  
程豪  黄磊  刘昌平  谭怒涛 《自动化学报》2008,34(10):1312-1318
在定位和验证的两级框架下提出了一种新的视频文字定位算法. 在定位模块中, 充分利用字符的笔画属性, 引入对字符区域有很强的响应的笔画算子; 经笔画提取, 密度过滤, 区域分解得候选文本行. 在验证模块中, 提取对文字有较强鉴别能力的边缘方向直方图特征, 使用Adaboost算法训练的分类器对候选文本行进行筛选. 实验结果表明, 该算法具有较强的鲁棒性, 在不同类型的视频帧中都能得到较好的定位结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号