首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 42 毫秒
1.
针对在自然场景中文本定位需要大量样本训练导致算法运行速度较慢且倾斜文本难以定位的问题,提出了一种基于最大稳定极值区域(maximally stable extremal regions,MSER)结合层次聚类的快速自然场景倾斜文本定位算法。利用MSER椭圆拟合的方法对图片进行最大极值稳定区域的选取,并根据拟合椭圆的自身特征和在图像上的位置特征,过滤掉大部分的非文本区域,筛选出文本候选区域。运用层次聚类的思想,快速对文本区域逐层聚类融合,最终将单个的文本区域合并成单词区域,实现高效的倾斜场景文本定位。实验结果表明,与传统的定位算法相比,该算法在没有损失定位精度的情况下运算速度有明显的提升。  相似文献   

2.
针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法。算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构元参数并对图像进行动态闭操作,以消除同一汉字笔画之间的间隙,得到候选汉字区域;利用结构和角点规则过滤掉非汉字区域,并用颜色规则聚类得到候选文本区域;最后基于图像文本大都横向或纵向排列的规律,通过分析各组连通区的分布情况,对候选文本区域进行确定。在测试数据集上的实验表明,算法对于汉字与背景色差明显、汉字成行或成列排列等场景文本具有定位稳定性和准确性。  相似文献   

3.
提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,采用多个阈值对其进行MSER区域检测,并将检测到的区域作为候选区域用于文本检测.检测过程中,对候选区域提取手工设计的底层特征和基于卷积神经网络(CNN)的深层特征,训练一个随机森林回归器对特征进行分类得到字符区域,再将其合并成单词区域,并进行相似的特征提取和分类,从而得到最终的文本检测结果.使用2个标准的数据库(ICDAR2011和ICDAR2013)对提出的方法进行性能评价,F指标在ICDAR2011和ICDAR2013上均为0.79,表明了所提出的自然场景文本检测方法的有效性.  相似文献   

4.
基于注意力机制和多层次特征融合的目标检测算法   总被引:1,自引:0,他引:1  
为了提高目标检测的准确率,提出一种基于注意力机制和多层次特征融合的图像目标检测算法。该算法在Cascade R-CNN模型的基础上,以RseNet50为主干网络,通过嵌入简单的注意力模块(SAM)来提高网络的判别能力;其次,利用深度可分离卷积改进特征金字塔网络(FPN),设计了多层次特征融合模块(MFFM),对多尺度特征进行融合,以丰富特征图的信息量,并对不同层次的特征图赋予相应的权重以平衡不同尺度的特征信息;最后,结合目标检测方法中的区域建议网络(RPN)结构获取目标的候选区域进行分类和回归处理,确定检测目标的位置和类别。实验结果表明,相较于Cascade R-CNN目标检测算法,该算法的检测精度提升了约2.0%。  相似文献   

5.
传统图像质量评价算法往往采用单一特征进行质量评价,导致图像中很多重要信息丢失,本文针对这一不足提出了一种融合多特征的改进算法。该算法首先根据人眼视觉系统特性提取亮度分量,将彩色图像亮度分量与Scharr算子进行卷积,提取图像的边缘特征,计算结构相似度描述子;然后提取图像的局部方向模式纹理特征,利用直方图相交距离得到纹理相似度描述子;最后综合两者结果构建了一种新的图像质量评价方法。在LIVE数据库中对JP2K、JPEG、Fast Fading三种类型的失真进行了对比实验。结果表明:该算法和其他被广泛采用的图像质量评价算法相比,评价结果总体上与主观评价结果具有更高的一致性,尤其对Fast Fading图像效果非常好。  相似文献   

6.
针对图像问因具有旋转及光线强度差异等现象而导致的拼接效果不佳及拼接速度慢的问题,提出一种基于特征点的配准算法。该算法首先利用相位相关法确定图像重叠区域,然后采用改进Harris角点检测算法检测角点,再根据相似测度NCC(NormalizedCrossCorrelation)方法提取出匹配特征点对,最后用渐进渐出的方法实现拼接图像的融合。实验证明,该算法比传统算法在角点数目上减少了四分之一,有效地去除了拼接产生的鬼影现象。能有效地提高图像拼接的速度和精度。  相似文献   

7.
针对传统的加速稳健特征(SURF)算法在图像拼接过程中计算复杂度高以及匹配精度不佳等问题,提出一种基于SURF的改进算法,首先基于加速分割检测特征(FAST)算法快速提取图像特征点,利用SURF算法对提取到的特征点进行特征描述,然后通过改进的k-d树最近邻查找算法(BBF)寻找图像间的匹配点,与双向匹配的自适应阈值配准法相结合进行图像的匹配,利用改进的随机抽样一致性(RANSAC)算法对提取的特征点进行误匹配剔除,最后使用渐入渐出的加权融合算法对图像进行拼接。实验表明与传统的SURF+RANSAC算法相比,本文算法的图像拼接速度快,匹配精度更高。  相似文献   

8.
一种新的基于分形特征融合的图像目标识别算法   总被引:2,自引:0,他引:2  
提出了一种基于多分形特征融合的目标识别算法.在此算法中,将分形理论与D-S证据融合理论相结合,提取或构造了分形特征,设计了合理的概率分配函数,并对所提出的算法进行了仿真研究,并将此算法的识别结果与基于单分形特征的识别算法、基于神经网络的目标识别算法进行比较,结果表明本算法是可行的和有效的.  相似文献   

9.
针对智能会议环境下基于单模特征的人脸识别的识别率低、鲁棒性差的问题,提出了一种在智能会议室环境下基于核相关权重鉴别分析(KRWDA)算法的融合全局和局部特征的多特征融合人脸识别方法。基于相关权重鉴别分析算法并结合核方法,提出了一种核相关权重鉴别分析算法,有效解决了小样本问题。利用全局特征和局部特征在识别时所描述的内容和作用的互补性在特征层融合两种特征,全局信息和局部信息分别采用离散余弦变换和Ga-bor小波变换提取。在AMIES2016数据库上的仿真实验表明,本文所提出的方法可以有效地提高系统身份识别的正确率。  相似文献   

10.
为了提高图像匹配算法的性能,使用一种改进的K-d树改善特征点匹配时的数据检索方式,用随机抽样一致性算法对提取的匹配对进行提纯.实验结果表明,在不同尺度及旋转、不同视角、不同光线的情况下,此算法剔除了误匹配的特征点和不必要的特征点,提高了图像匹配的精度.  相似文献   

11.
该文提出了一种句子级别的中文文本复制检测方法。该方法以句子为基本复制检测单位,运用最长公共子序列算法计算两篇文本之间的重复度,根据所得的重复度值来检测两篇文本是否存在复制现象以及复制的程度。在方法中,剔除句子的其他成分,提取句子中的名词作为句子的文本特征,增加了算法的鲁棒性;建立句子与文档的倒排索引,可快速索引得到存在该句子的所有文档的集合,提高了算法的速度,为大规模文本复制检测提供了一种可行的方法。实验表明,该算法对于普通网页文本复制检测能取得很好效果。  相似文献   

12.
非降采样Contourlet域方向区域多聚焦图像融合算法   总被引:3,自引:2,他引:1  
提出了一种基于方向区域特性的非降采样Contourlet域多聚焦图像融合算法。算法将图像进行非降采样Contourlet变换为不同方向的高低频子带,低频子带和高频子带中分别采用方向区域的方差匹配度和能量作为融合规则,其中方向区域与当前子带分解方向保持一致,最后,通过反变换得到融合图像。实验结果表明,本文提出的方向区域方法能够更好地体现二维图像中的曲线或直线状边缘特征。将现有的融合算法和本文所提算法进行了主观和客观的对比,结果表明,基于非降采样Contourlet变换的方向区域特性的图像融合算法是一种有效可行的图像融合算法。  相似文献   

13.
传统SAR变化检测使用单一描述来提取多时相SAR图像间的变化信息,没有充分挖掘图像中的多特征信息,导致复杂变化场景下算法检测精度不高.针对这一问题,提出一种基于多种特征融合的SAR图像变化检测方法.该方法首先对多时相SAR图像输电走廊区域进行多种特征提取,并选取合适SAR变化检测的特征,然后在多时相SAR图像中计算每种特征对应的差异图,最后从图像融合的角度分别使用主成分分析法(PCA)和证据推理理论(DST)对这些多特征对应的差异图进行融合并提取最终的变化检测结果.实验结果表明该方法具有较为满意的变化检测效果.  相似文献   

14.
在人类交互行为识别领域,基于RGB视频的局部特征往往不能有效区分近似动作,将深度图像(Depth)与彩色图像(RGB)在识别过程中进行融合,提出一种融合Depth信息的整体和个体分割融合的双人交互行为识别算法。该算法首先分别对RGB和Depth视频进行兴趣点提取,在RGB视频上采用3DSIFT进行特征描述,在Depth视频上利用YOLO网络对左右两人兴趣点进行划分,并使用视觉共生矩阵对局部关联信息进行描述。最后使用最近邻分类器分别对RGB特征和Depth特征进行分类识别,进一步通过决策级融合两者识别结果,提高识别准确率。结果表明,结合深度视觉共生矩阵可以大大提高双人交互行为识别准确率,对于SBU Kinect interaction数据库中的动作可以达90%的正确识别率,验证了所提算法的有效性。  相似文献   

15.
为了在红外与可见光图像融合中保留更多有效信息,提出一种基于区域显著性分析的融合方法.通过区域分割以及多分辨率对比度分析,获得图像的尺度不变区域显著性图(RSISM).利用RSISM能够有效表达区域的显著性特征,合理区分不同性质的区域;根据RSISM划分显著性区域、背景区域及中间区域,对各区域制定相异融合规则,并在非降采样轮廓波变换(NSCT)变换域上融合双波段图像.实验证明,与传统方法相比,该方法能够更好地保留显著性区域的红外特征及其他区域的细节信息,同时对背景热辐射干扰不敏感,有较好融合效果,并能够拓展应用于动态图像的融合中.  相似文献   

16.
特征融合方法是模式识别领域的一种重要方法.计算机视觉领域的图像识别问题作为一种特殊的模式分类问题,仍然存在很多挑战.特征融合方法能够综合利用多种图像特征,实现多特征的优势互补,获得更加鲁棒和准确的识别结果.笔者基于信息融合理论分析了特征融合方法的原理,介绍了特征融合方法的研究现状,讨论了特征融合与3类主流基础理论相结合的方法,其中基于贝叶斯理论的特征融合算法可以实现多特征的融合决策,基于稀疏表示理论的特征融合算法能够得到多特征的联合稀疏表示,基于深度学习理论的特征融合算法能够强化深度神经网络模型的特征学习过程.  相似文献   

17.
针对现有的局部特征提取算法,如尺度不变特征变换、加速稳健特征等对面积较小的篡改区域和平滑区域无法准确提取特征点进行复制粘贴篡改检测的问题,提出了一种基于色调、饱和度、明度(HSV)颜色空间和限制对比度自适应直方图均衡化(CLAHE)的2阶段篡改检测方法.第1阶段,将待检测图像从红、绿、蓝颜色空间转换到(HSV)颜色空间进行加速稳健特征提取;第2阶段,针对平滑区域的篡改,通过CLAHE算法对图像进行特征增强之后,再采用加速稳健特征进行特征提取;然后利用广义2近邻算法进行特征匹配,并利用随机抽样一致性算法剔除错误的匹配点;最后通过形态学操作实现篡改区域的标示定位.实验结果表明,该算法能抵抗小面积区域和具有非显著视觉特征的平滑区域复制粘贴篡改,并对旋转、缩放等后处理攻击具有一定的鲁棒性.  相似文献   

18.
提出一种基于小波变换的图像融合新算法。在处理低频部分时,采用了基于局部能量的低频系数融合方案;在处理高频部分时,依照一定的原则,自定义了特征边缘点和非特征边缘点、有效边缘区和有效平滑区,并根据不同的区域特征提出了一种基于小波区域梯度的图像融合新算法。最后,利用信息熵、均方差、空间频率来评价新融合算法的效果。仿真实验结果表明,相比传统的图像融合算法,该融合算法可达到更好的效果。  相似文献   

19.
提出了一种新的基于局部特征点的图像检索算法。首先将彩色图像转换成灰度图像,并利用Harris算子对灰度图像进行"角点"检测,根据"角点"的分布确定目标区域,然后在彩色图像目标区域中提取图像的颜色特征和空间特征表述图像内容。实验证明,该算法在查准率和查全率上要优于基于全局特征的算法。  相似文献   

20.
提出一种改进的多类别单阶检测器(SSD)算法. 借鉴特征金字塔算法的思想,将Conv4-3层的特征与Conv7、Conv3-3层的特征进行融合,同时增加融合后特征图每个位置对应的默认框数量. 在网络结构中增加裁剪-权重分配网络(SENet),对每层的特征通道进行权重分配,提升有用的特征权重并抑制无效的特征权重. 为了增强网络的泛化能力,对训练数据集进行一系列增强处理. 实验结果表明,改进后的算法在VOC数据集(07+12)上的检测效果良好,平均精度均值为80.4%,比改进前的算法提高了2.7%;在COCO数据集(2017)上的平均精度均值为42.5%,比改进前的算法提高了2.3%. 所提算法能够准确检测出不小于16×16像素的目标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号