首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
文本检测技术在社会中有着广泛的应用,随着深度学习的加入,文本检测技术得到了进一步的提升。近年来基于深度学习的检测算法逐渐增多,针对场景文本检测的各种问题提出了相应的解决方法,提升了场景文本检测算法的性能。本文对这些算法进行了归纳、分析和总结,将这些算法大致分为基于回归和基于分割两种类型,并对其性能进行了对比,最后基于这些算法的研究内容为文本检测领域未来的发展提出了新的研究方向。  相似文献   

2.
针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了 一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干 网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息; 其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大 小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果 表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、 77.0%和81.3%,相比其他基于分割的算法,该算 法对弯曲文本的检测效果良好,具有一定的 应用价值。  相似文献   

3.
4.
为进一步解决自然场景下文本方向多变、形状不规则以及分布密集等分割问题,提出了一个由特征金字塔网络(Feature Pyramid Network,FPN)和并行多空洞卷积(Parallel Multiscale Atrous Convolution,PMAC)模块构成的FPPMAC模型.其中,PMAC模块由4个空洞卷积...  相似文献   

5.
6.
7.
《现代电子技术》2018,(8):167-170
针对当前文本分类神经网络不能充分提取词语与词语和句子与句子之间的语义结构特征信息的问题,提出一种基于LSTM-Attention的神经网络实现文本特征提取的方法。首先,分别使用LSTM网络对文本的词语与词语和句子与句子的特征信息进行提取;其次,使用分层的注意力机制网络层分别对文本中重要的词语和句子进行选择;最后,将网络逐层提取得到的文本特征向量使用softmax分类器进行文本分类。实验结果表明,所提方法可以有效地提取文本的特征,使得准确率得到提高。将该方法应用在IMDB,yelp2013和yelp2014数据集上进行实验,分别得到52.4%,66.0%和67.6%的正确率。  相似文献   

8.
本文提出了一种基于深度神经网络的高效自然场景文本检测模型IEAST (Improved EAST).该模型基于EAST (An Efficient and Accurate Scene Text Detector)进行了一系列改进,同时结合了物体检测以及实例分割的思想,通过用Inception Module替换原本特征融合的方式、加入Path Aggregation的思想以及采用Fuzzy Mask来提升模型的整体性能.IEAST是一段式模型,其不仅检测准度上不落后于绝大多数二段式State-of-the-art的文本检测模型,还能保证极快的检测速度.  相似文献   

9.
图像作为记录生活和储存信息的重要途径之一,是人对视觉感知的物质的一种再现,同时也是对现实场景的一种真实写照.面对海量的图像数据,如何准确高效的提取图像特征,获取有用信息,将信息转化为所需特征,是需要解决的问题.针对这一问题,本文提出的基于CSLBP模糊图像特征提取与检测方法很好的解决了这一问题.同时结合HOG特征提取与...  相似文献   

10.
为了解决自然场景文本检测中由于文本实例分布随机、形态与尺度多样造成的检测难题,设计了一种基于注意力机制特征融合与增强的自然场景文本检测算法。利用注意力机制对有效特征提取的优势,在模型的解码融合阶段设计并引入了一种基于注意力的特征融合模块(Attention-based Feature Fusion Module, AFFM),利用空间和通道注意力分别为高层特征和低层特征引入更丰富的细节和全局信息,进一步提高了检测的准确率;设计了联合注意力特征增强模块(Joint Attention Feature Enhancement Module, JAM),利用卷积对级联后的特征在不同通道之间、空间位置间的联系建模,并生成联合特征权重mask对级联特征做加权,从而提高信息的表征能力,有效减少误检与漏检。在Total-Text和ICDAR2015两个数据集上对模型做评估,测试结果表明,该方法的F1综合指标分别达到了85.1%和87.6%,均优于当前主流算法。  相似文献   

11.
王霏  黄俊  文洪伟 《电讯技术》2022,62(1):130-137
针对深度学习文本检测算法存在运行速度慢、模型体积大等问题,提出了基于改进的YOLOv3(You Only Look Once v3)文本检测方法(mobile-text-YOLOv3).通过深度可分离卷积思想轻量化Darknet-53网络,在高层特征借助双线性插值和偏移层使卷积核具有可变感受野,较大地改善了模型的性能;...  相似文献   

12.
月球表面溅射物中的砾石检测可用于实现自主着陆、航天器和月球车自动避障等任务。针对与月表背景差异不明显的砾石检测问题,提出一种检测方法,该方法基于改进后的YOLO V3模型对美国月球侦察轨道器(Lunar Reconnaissance Orbiter,LRO)窄角相机(Narrow Angle Camera,NAC)高分辨率月球遥感影像进行训练和测试。实验对比了原始YOLO V3和改进后的YOLO V3方法的检测效果。结果表明,改进后的YOLO V3模型较原始模型的准确率提高了10.5%,召回率提升22.8%,检测速度提升1.69倍,在数据集中的漏检和误检现象也轻于原始YOLO V3网络。  相似文献   

13.
针对传统的网络流量异常检测方法存在识别准确度低、表征能力弱、泛化能力差,忽略了特征之间的相互关系等问题,该文提出一种基于二次特征提取和BiLSTM-Attention的网络流量异常检测方法。通过使用双向长短期记忆网络(BiLSTM)学习数据之间的特征关系,完成数据的一次特征提取,在此基础上,定义一种基于注意力机制的特征重要性权重评估规则,依据特征重要性大小对BiLSTM生成的特征向量给予相应的权重,完成数据的二次特征提取。最后,提出一种“先总分后细分”的设计思想构建网络流量异常检测模型,实现多分类网络流量的异常检测。实验结果表明,该文所提方法在性能上要优于传统单一的模型,并且具有良好的表征能力和泛化能力。  相似文献   

14.
工业场景下标签图像存在扫描不清晰、光照变化大,文字大小不一致等问题,给文本的检测带来困难。针对上述问题,提出了基于分割的可微分二值化(differentiable binarization net, DBNet)网络的文本检测方法。首先通过数据增强技术对样本数据量进行了扩张;然后根据标签文本细长的特点,分析了Douglas-Peucker算法的超参数调整对检测精度的影响。实验结果表明可微分的二值化网络DBNet具有更好的检测性能,在测试集上的准确率、召回率、F1值分别达到了99.4、99.5、99.5。  相似文献   

15.
早期筛查病因和诊断病情已被证明可以显著提升癌症患者的存活率,因此准确解读医学图像成为早期癌症筛查的关键。基于内容的医学图像检索系统(Content-based Medical Image Retrieval, CBMIR)能够对输入医学图像进行特征提取得到对应图像的特征表示,最后通过相似性度量的方法找出相似病例的诊断资料反馈给医生,可以大大减少误诊率。文章主要介绍了基于深度学习医学图像特征提取方法,并对医学图像特征提取方向做了总结与展望。  相似文献   

16.
针对YOLO V3算法中对于小目标检测精度不高、容易出现漏检误检的问题,提出了一种基于改进YOLO V3的舰船目标检测算法.首先,通过在YOLO V3原网络结构基础上额外从主干网络引出一个输出尺度,将其与上一个输出尺度中的特征信息进行特征拼接,得到具有更丰富语义信息的特征向量;其次,基于数据集进行聚类改进,改进度量距离...  相似文献   

17.
针对浮法玻璃生产过程中,因原料、燃料、工艺等差异而获得的玻璃本体中带有典型特征的端面条纹图像的问题,提出基于YOLOv3的玻璃条纹检测方法.采集玻璃成品的原始图片,并使用LabelImg对玻璃图片进行标注,生成包含六种玻璃条纹类别的数据集,以Darknet-53网络为基本框架,构建训练模型及调整参数.通过分析,当学习率...  相似文献   

18.
鉴于深度学习模型在进行知识推理相关研究时提取抽象概念的优势,在目前对文本特征提取性能较好的浅层结构RSM的基础上构建以RSM为特征抽取器的深度玻尔兹曼机模型.通过新模型的能量函数和网络连接关系,对模型组成单元的后验概率进行推导,并结合新的交叉熵稀疏惩罚因子,给出模型的详细学习算法.经20-newgroups文档集上测试证明,经过交叉熵稀疏惩罚因子影响后的新模型提取出的特征在对文本表征上性能较好,相比于浅层模型RSM,其分类准确度更高,概念更加抽象,在处理大规模文本分析上具有良好的可行性.  相似文献   

19.
裂缝是常见的路面损坏现象。由于裂缝容易扩展,对早期裂缝进行检测具有重要的现实意义。传统的人工裂缝检测极其耗时耗力,研究人员已将注意力转向自动裂缝检测。尽管自动裂缝检测在过去几十年中得到了广泛的研究,但由于裂缝的不均匀性和路面环境的复杂性,它仍然是一项具有挑战性的任务。为了解决这些问题,提出一种基于改进的Deeplab V3+网络的路面裂缝分割模型。在原始Deeplab V3+网络的基础上将主干网络替换成resnet-50网络,并对空洞空间卷积池化金字塔模块进行了级联操作。为了验证所提出方法的有效性,在CRACK500数据集上进行了训练和测试。本文方法在CRACK500数据集上的平均交并比(Mean Intersection over Union,MIoU)和平均像素精度(Mean Pixel Accuracy,MPA)达到了0.8315和0.8614,优于原始Deeplab V3+网络的检测结果。  相似文献   

20.
为了解决传统的文本极性智能判断方法判断结果准确率和召回率普遍较低的问题,基于改进深度学习算法研究一种新的文本极性智能判断方法。在CNN结构基础上设计一种新的深度学习算法模型,模型由输入层、输出层、采集层、连接层、卷积层五部分构成。使用该模型对文本进行智能判断,判断过程共有五步,分别是文本预处理、情感词提取、表情符号提取、感情倾向值计算和情感最终倾向值分析。为检测所提方法的有效性以及优越性,与传统判断方法进行实验对比,结果表明,基于改进深度学习算法的文本极性智能判断方法判断的准确率和召回率更高,发展空间更广阔。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号