期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

殷绪成刘昌平《自动化学报》2007,33(3):315-322

粘连断裂字符行的切分识别,是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi 算法的切分识别方案,该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi 算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi 算法来合并前面得到的候选切分图像块,进行动态切分与识别. 实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性. 相似文献

2.

手写中文信封的地址行字符切分算法

韩智刘昌平殷绪成《中文信息学报》2006,20(1):87-92

在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。相似文献

3.

二值网络的分阶段残差二值化算法

任红萍陈敏捷王子豪杨春殷绪成《计算机系统应用》2019,28(1):38-46

二值网络在速度、能耗、内存占用等方面优势明显，但会对深度网络模型造成较大的精度损失.为了解决上述问题，本文提出了二值网络的"分阶段残差二值化"优化算法，以得到精度更好的二值神经网络模型.本文将随机量化的方法与XNOR-net相结合，提出了两种改进算法"带有近似因子的随机权重二值化"和"确定权重二值化"，以及一种全新的"分阶段残差二值化"的BNN训练优化算法，以得到接近全精度神经网络的识别准确率.实验表明，本文提出的"分阶段残差二值化"算法能够有效提升二值模型的训练精度，而且不会增加相关网络在测试过程中的计算量，从而保持了二值网络速度快、空间小、能耗低的优势. 相似文献

4.

基于深度学习的场景文字检测综述 总被引：1，自引：0，他引：1

姜维张重生殷绪成《电子学报》2019,47(5):1152-1161

近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文还展望了未来发展趋势,指出未来研究热点. 相似文献

5.

AI设计下的文本视觉问答技术

晋赞霞覃京燕殷绪成《包装工程》2021,42(6):7-12

目的分析基于AI设计的文本视觉问答模型的有效性,旨在利用AI设计更好地指导当前AI模型的构建,提升模型效果和用户体验.方法以传统文本视觉问答框架为基础,结合AI设计改进当前模型.具体包括加强基于场景设计原则的关系挖掘,根据不同理解层次需求的答案关键词预测,并对模型被投入应用所将面临的问题的分析.结果基于AI设计完善模型可进一步提升模型效果;同时,通过AI设计对不同年龄认知差异的建模可指导回复生成,提升整体用户体验.结论通过理论分析和实验对比,可以得出AI设计是AI技术投入到应用的一个重要步骤.基于AI设计对模型进行重构,可提高当前模型的效果,解决AI技术落地中将面临的用户体验问题,满足不同人群的需求. 相似文献

6.

AI设计下的智能驾驶场景文本识别技术

梁敏秦海波覃京燕殷绪成《包装工程》2021,42(6):13-19

目的交通标志识别作为智能驾驶、交通系统研究中的一项重要内容,具有较大的理论价值和应用前景.尤其是文本型交通标志,其含有丰富的高层语义信息,能够提供极其丰富的道路信息.因此通过设计并实现一套新的端到端交通标志文本识别系统,达到有效缓解交通拥堵、提高道路安全的目的.方法系统主要包括文本区域检测和文字识别两个视觉任务,并基于卷积神经网络的深度学习技术实现.首先以ResNet-50为骨干网络提取特征,并采用类FPN结构进行多层特征融合,将融合后的特征作为文本检测和识别的共享特征.文本检测定位文本区域并输出候选文本框的坐标,文字识别输出词条对应的文本字符串.结果通过实验验证,系统在Traffic Guide Panel Dataset上取得了令人满意的结果,行识别准确率为71.08％.结论端到端交通标志文本识别非常具有现实意义.通过卷积神经网络的深度学习技术,提出了一套端到端交通标志文本识别系统,并在开源的Traffic Guide Panel Dataset上证明了该系统的优越性. 相似文献

7.

《中国图象图形学报》文档图像智能处理与识别专栏简介

下载免费PDF全文

刘成林金连文殷绪成白翔连宙辉彭良瑞刘禹良陈秀妍《中国图象图形学报》2023,28(8):2221-2222

相似文献

8.

开放集文字识别技术

下载免费PDF全文

杨春刘畅方治屿韩铮刘成林殷绪成《中国图象图形学报》2023,28(6):1767-1791

开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别（open-set text recognition,OSTR）任务。该任务要求,算法在测试（推断）阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时,针对开放集文字识别三大问题（未知样本发现、新类别识别和上下文信息偏差）,从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望。相似文献

9.

层次型金融票据图像分类方法 总被引：4，自引：0，他引：4

殷绪成江世盛韩智刘昌平《中文信息学报》2005,19(6):72-79

金融票据图像识别处理是当今的一个热点研究方向,而票据分类是其中重要的基础部分。针对种类繁多、数量巨大、版面复杂和噪声干扰严重的金融票据彩色图像,本文提出了一种基于二叉树决策的层次型票据类型匹配方法。该方法利用三个类型判断器:基于票据版面结构的松弛匹配、基于OCR 的票据标题识别和基于票据颜色的色彩分析,层次化的进行票据类型判断。实验表明,层次型金融票据图像分类方法具有良好的效果;基于该方法的银行票据识别处理系统已经广泛应用于各大银行的相关业务系统中。相似文献

10.

基于图像理解的能见度测量方法 总被引：1，自引：0，他引：1

许茜殷绪成李岩郝红卫曹晓钟《模式识别与人工智能》2013,26(6):543-551

现存的大气能见度测量方法主要存在硬件成本高、操作复杂度大、应用范围小等问题。文中将机器学习引入能见度测量,提出一种基于图像理解的白天能见度测量方法。首先在对测量场景图像感兴趣区域分窗处理的基础上,设计并提取基于像素对比度的图像特征及向量。然后,通过训练支持向量回归机构建图像特征与能见度值之间的关系模型。最后,根据模型计算待测图像的能见度值。实验结果表明该方法不仅具有良好的能见度测量精度,同时具有较高的灵活性,能降低已有能见度测量的局限性。相似文献