首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
吕伶  李华  王武 《图学学报》2024,(1):56-64
针对自然场景文本长度不定、角度倾斜等难题,提出了一种基于增强特征提取网络与语义特征融合的文本检测方法。通过结合可变形卷积与空洞卷积,设计了一种增强扩张残差模块EDRM (Enhanced Dilated Residual Module),将其应用于ResNet18的conv4_x与conv5_x层,并以此作为骨干网络,在改善网络特征提取能力的同时提高特征图像分辨率,减少空间信息丢失。其次,针对现有算法提取文本语义特征仍不充分的问题,将双向长短期记忆网络BiLSTM (Bi-directional Long Short-Term Memory)引入特征融合部分,增强融合特征图对自然场景文本的表征能力以及特征序列的关联性,同时提高模型的文本定位能力。在多方向文本数据集ICDAR2015、长文本数据集MSRA-TD500上对模型展开评估,实验结果表明,该算法与当下高效的DBNet算法相比,F值分别提升1.8%、3.3%,表现出良好的竞争力。  相似文献   

2.
目的 场景文本检测是场景理解和文字识别领域的重要任务之一,尽管基于深度学习的算法显著提升了检测精度,但现有的方法由于对文字局部语义和文字实例间的全局语义的提取能力不足,导致缺乏文字多层语义的建模,从而检测精度不理想。针对此问题,提出了一种层级语义融合的场景文本检测算法。方法 该方法包括基于文本片段的局部语义理解模块和基于文本实例的全局语义理解模块,以分别引导网络关注文字局部和文字实例间的多层级语义信息。首先,基于文本片段的局部语义理解模块根据相对位置将文本划分为多个片段,在细粒度优化目标的监督下增强网络对局部语义的感知能力。然后,基于文本实例的全局语义理解模块利用文本片段粗分割结果过滤背景区域并提取可靠的文字区域特征,进而通过注意力机制自适应地捕获任意形状文本的全局语义信息并得到最终分割结果。此外,为了降低边界区域的预测噪声对层级语义信息聚合的干扰,提出边界感知损失函数以降低边界区域特征的歧义性。结果 算法在3个常用的场景文字检测数据集上实验并与其他算法进行了比较,所提方法在性能上获得了显著提升,在Totoal-Text数据集上,F值为87.0%,相比其他模型提升了1.0%;在MSRA-TD500(MSRA text detection 500 database)数据集上,F值为88.2%,相比其他模型提升了1.0%;在ICDAR 2015(International Conference on Document Analysis and Recognition)数据集上,F值为87.0%。结论 提出的模型通过分别构建不同层级下的语义上下文和对歧义特征额外的惩罚解决了层级语义提取不充分的问题,获得了更高的检测精度。  相似文献   

3.
针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。  相似文献   

4.
现有算法所提取的语义信息还不够丰富,影响了显著性目标检测的性能.因此,提出了一种多尺度特征金字塔网格模型来增强高层特征包含的语义信息.首先,采用特征金字塔网格结构对高层特征进行增强;其次,采用金字塔池模块对最高层特征进行多尺度操作;最后,引入非对称卷积模块,进一步提高算法性能.所提模型与其他14种显著性目标检测算法在4个数据集上进行了比较,实验结果表明所提算法能够有效提升著性目标检测的性能,特别是在复杂场景下效果更加明显.  相似文献   

5.
EAST算法是一种高效而准确的场景文本检测算法,但是由于受到感受野的限制,导致在检测小文本时容易出现误检、漏检现象,在检测较长文本时缺乏一定的完整性。针对以上问题,提出一种基于多分支特征融合的自然场景文本检测算法。该算法以EAST算法为基础,引入并改进了浅层特征增强模块(RFB-s),在避免小文本信息损失的前提下,增大浅层网络的感受野改善浅层特征语义信息不足的问题,增强对小文本定位的准确性。引入并改进了循环十字交叉注意力模块(RCCAM),使得特征图中的每个像素能够以非常有效的方式捕获全图像的上下文信息,提高对长文本的检测能力。同时针对回归任务,采用Dice Loss作为损失函数,解决正负样本占比不均衡问题。采用EIoU来提高回归的效果,得到更为精准的文本框。该算法在ICDAR2015和MSRA-TD500数据集上进行测试,均获得了不错的检测效果。表明了该算法能够有效地对自然场景文本进行检测,提高了检测的准确率。  相似文献   

6.
增强语义信息与多通道特征融合的裂缝检测   总被引:1,自引:0,他引:1       下载免费PDF全文
路面裂缝检测是用以判断道路安全与否的关键技术,由于裂缝的背景复杂多样,传统的裂缝检测算法难以准确检测裂缝。提出了一种增强语义信息与多通道特征融合的裂缝自动检测算法。网络整体为编码器-解码器结构,在编码器部分引入扩张卷积模块,扩大特征图有效感受野,整合图像上下文信息,增强特征语义表达能力,提高像素分类精度。在解码器部分搭建了一个基于注意力机制的多通道特征融合模块,利用高层全局注意力信息指导高层语义特征与低层细节特征的逐级融合,有利于恢复图像细节信息,进一步提升对裂缝的像素级检测精度。实验结果表明,在CRACK500公开数据集上训练的模型在测试集上取得72.5%的平均交并比(Intersection over Union,IoU)和96.8%的F1score,该模型直接用于CrackForest数据集测试,平均IoU和F1score分别提升2.0个百分点和1.1个百分点,表明模型具有很好的泛化性能,可用于复杂道路场景下的裂缝检测与质量评估。  相似文献   

7.
目前,基于深度学习的自然场景文本检测在复杂的背景下取得很好的效果,但难以准确检测到小尺度文本.本文针对此问题提出了一种基于特征融合的深度神经网络,该网络将传统深度神经网络中的高层特征与低层特征相融合,构建一种高级语义的神经网络.特征融合网络利用网络高层的强语义信息来提高网络的整体性能,并通过多个输出层直接预测不同尺度的文本.在ICDAR2011和ICDAR2013数据集上的实验表明,本文的方法对于小尺度的文本,定位效果显著.同时,本文所提的方法在自然场景文本检测中具有较高的定位准确性和鲁棒性,F值在两个数据集上均达到0.83.  相似文献   

8.
针对现有人脸检测算法难以处理多尺度、多姿态的人脸检测,尤其是面对小尺寸时准确性低的问题,提出了多尺度和纹理特征增强的小尺寸人脸检测算法。该算法的多尺度增强模块能够丰富特征的多尺度信息,提高对多尺度人脸的检测能力;纹理特征增强模块能够通过融合低层的纹理信息提升高层语义的表达,从而加强对小尺寸人脸的检测能力;多阶段加权损失函数平衡网络的输出,充分发挥各个模块的增强作用。实验结果表明,该方法不仅在检测速度上可以达到实时,而且对MALF数据集中高度小于60像素的人脸检测精度可达88.69%;在FDDB数据集上相比目前的BBFCN算法精度提高近四个百分点。  相似文献   

9.
自然场景中的文本检测对于视频、图像和图片等海量信息的检索管理具有重要意义.针对自然场景中的文本检测面临着图像背景复杂、分辨率低和分布随意的问题,提出一种场景文本检测的方法.该方法将最大稳定极值区域算法与卷积深度置信网络进行结合,把从最大稳定极值区域中提取出来的候选文本区域输入到卷积深度置信网络中进行特征提取,由Softmax分类器对提取的特征进行分类.该方法在ICDAR数据集和SVT数据集上进行实验,实验结果表明该方法有助于提高场景文本检测的精确率及召回率.  相似文献   

10.
目的 获取场景图像中的文本信息对理解场景内容具有重要意义,而文本检测是文本识别、理解的基础。为了解决场景文本识别中文字定位不准确的问题,本文提出了一种高效的任意形状文本检测器:非局部像素聚合网络。方法 该方法使用特征金字塔增强模块和特征融合模块进行轻量级特征提取,保证了速度优势;同时引入非局部操作以增强骨干网络的特征提取能力,使其检测准确性得以提高。非局部操作是一种注意力机制,能捕捉到文本像素之间的内在关系。此外,本文设计了一种特征向量融合模块,用于融合不同尺度的特征图,使尺度多变的场景文本实例的特征表达得到增强。结果 本文方法在3个场景文本数据集上与其他方法进行了比较,在速度和准确度上均表现突出。在ICDAR(International Conference on Document Analysis and Recognition) 2015数据集上,本文方法比最优方法的F值提高了0.9%,检测速度达到了23.1 帧/s;在CTW(Curve Text in the Wild) 1500数据集上,本文方法比最优方法的F值提高了1.2%,检测速度达到了71.8 帧/s;在Total-Text数据集上,本文方法比最优方法的F值提高了1.3%,检测速度达到了34.3 帧/s,远远超出其他方法。结论 本文方法兼顾了准确性和实时性,在准确度和速度上均达到较高水平。  相似文献   

11.
以当前信息化社会环境为基点,概括了信息素养的基本定义,讨论了高校学生的信息素养含义,并从信息意识素养、信息伦理道德素养、信息处理能力素养、信息交流共享能力素养四个方面论述了高校学生应具备的信息素养结构。  相似文献   

12.
Abstract. This case study investigates various ways in which different internet-based information systems (IS) are used by organizational participants. Borrowing theoretical insights on information behaviour accumulated over 50 years of information studies research, a conceptual framework is presented to help understand and assess the social and organizational impacts of internet-based IS. The framework describes the use of internet-based IS as a dynamic cycle of information needs–seeking–use activity situated in the context of a firm's information environment. Research questions pertain to the process of how individuals in organizations seek and use information from internet-based IS to satisfy information needs. In terms of information needs, this involves understanding the problem situations that lead participants to use internet-based IS, as well as the characteristics of those problems beyond subject matter. With respect to information seeking, this involves analysing how information from internet-based systems is displayed and formatted to signal their potential usefulness. In terms of information use, this involves how information obtained from internet-based systems is used in practice to resolve or redefine problems. Both quantitative and qualitative research methods are used. Data collection involves web tracking to identify significant episodes of internet-based IS activity, as well as one-on-one interviews to explore the context behind these episodes. Results suggest that it is possible and valuable to identify scenarios of internet-based IS use dominant in an organizational work setting. Doing so can help to identify ways to improve the situated use of internet-based IS that ameliorate the information needs–seeking–use cycle in firms.  相似文献   

13.
以当前信息化社会环境为基点,概括了信息素养的基本定义,讨论了高校学生的信息素养含义,并从信息意识素养、信息伦理道德素养、信息处理能力素养、信息交流共享能力素养四个方面论述了高校学生应具备的信息素养结构。  相似文献   

14.
模糊信息优化处理技术应用简介   总被引:15,自引:0,他引:15  
本文介绍了模糊信息优化处理技术在人工神经网络、大地测量数据处理、风险分析、评估体系等四个方面的应用情况,并对该领域在基础理论、实用方法、商业应用等三个方面的发展进行了简短的讨论.  相似文献   

15.
计算机中的信息系统包括数据库、数据库运行、数据库的存放和传输等部分。为了保证信息的完整性及安全性,本文探究了威胁信息来源、信息流向、信息的执行及保存方面的因素,并且针对不同的信息威胁因素提出了解决威胁问题的方法。  相似文献   

16.
军队信息化建设发展日益深入,军队院校学员是未来军队信息化建设的中坚和骨干,学习运用信息化的程度,直接关系部队信息化建设的成效。介绍了信息素质的内涵,提出了培养学员信息素质的具体方法与措施。  相似文献   

17.
王永平 《计算机工程》2010,36(24):27-29
为满足用户广泛、准确、快速获取文物信息的要求,设计了数字博物馆文物信息获取系统。在设计过程中采用多线程、信息再过滤、信息重新分类等技术,对信息获取、信息分析、信息分类技术进行改进,解决了目前数字博物馆存在的信息来源局限性的问题,同时提高信息的准确性,使文物信息分类清晰,从而实现了文物信息的快速检索。  相似文献   

18.
论述了企业信息化建设的现状及发展情况。文章首先介绍了企业信息化建设取得的初步成效,分析了企业信息化建设值得注意的几个问题,最后提出了加快企业信息化建设的对策措施。  相似文献   

19.
网络信息的检索与挖掘回顾   总被引:1,自引:0,他引:1  
随着互联网的蓬勃发展,海量的网络信息成为了迄今为止最大规模的数据资源。如何利用海量网络信息,为人们提供智能应用,更好的解决人们的信息需求,成为了互联网领域的挑战性问题,也催生了对海量网络信息检索与挖掘的广泛研究。该文从信息表达、信息检索与信息挖掘三个方向入手,结合近年来对网络信息相关领域的研究与实践,对网络信息检索与挖掘的发展变化历程、目前存在的问题以及未来的发展趋势进行总结和分析。  相似文献   

20.
实现信息化管理是当前企业发展的必然要求,而信息化管理的实施则依赖于企业信息安全建设的发展程度。本文从设计院数据应用的实际需求出发,提出了信息安全管理制度建设的基本原则,并给出了保障信息安全的相关技术手段。科学完善的管理制度与相关技术手段相结合的管理模式较好地解决了企业信息安全的保障问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号