首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
吴静  杨武年  桑强 《计算机科学》2018,45(10):281-285
自然场景中的目标轮廓提取是计算机视觉中的一个重要研究问题。其难点在于场景中大量的纹理边缘严重地干扰了轮廓提取的完整性。近年来,一些研究工作将生物视觉特征引入图像边缘轮廓提取,取得了一定的效果。其中通过引入视觉外区抑制特征可以在提取物体轮廓边缘的同时抑制一定量的纹理边缘,从而得到轮廓边缘集合。然而在整合轮廓边缘时,传统模型仅仅采用求交并集的简单合并方法,使得强响应的细小纹理残留。基于此,提出了一种改进的基于生物视觉特征的自然场景目标轮廓提取算法。首先采用多水平抑制方法得到候选轮廓边缘集合。接着将一种基于生物视觉特征的边缘组合方法用于将候选边缘整合成为一个完整的目标轮廓。与传统的外区抑制算法相比,基于视觉特征的轮廓提取算法提高了自然场景中目标轮廓提取的准确性和完整性。  相似文献   

2.
针对常规分割算法难以将磁环缺陷从纹理复杂的磁环表面提取出来,本文提出了一种基于小波变换及边缘检测的缺陷提取算法.基于小波变换对磁环纹理的弱化作用,对小波分解低频部分采用自适应Canny边缘检测算法分割出含缺陷的边缘;基于阈值分割的轮廓查找算法,提取出磁环内外轮廓并作一定的处理;对含缺陷边缘和处理后内外轮廓做形态学处理和逻辑运算提取出磁环所有缺陷;对缺陷排序并提取出磁环主缺陷轮廓,判断轮廓闭合情况并填充轮廓得到主缺陷区域.实验表明本文算法正检率达94.7%.  相似文献   

3.
基于边缘检测的多文本页图像分割方法   总被引:2,自引:2,他引:0  
图像分割是图像处理中最困难的问题之一.针对光学字符识别(optical character recognition,OCR)系统的要求,提出了一种基于边缘检测的多文本页图像分割方法.先检测出由图像中边缘点构成的边缘直线,然后寻找出图像中每个文本页的4条边缘直线所构成的边界矩形,从而可将每个文本页准确分割出来.实验表明,该方法具有较快的速度和很高的正确率,是一种有效的方法.  相似文献   

4.
针对传统算法对边界模糊的图像分割效果不理想,分割结果多毛刺的问题,提出了一种由粗到细的图像边缘提取方法,主要由像素覆盖分割方法和Chan-Vese模型组成。将改进的覆盖分割方法和活动轮廓模型相结合,首先使用原始覆盖分割算法对图像进行分割,利用多方向模糊形态学边缘检测算法提取不同物体之间的边界;然后采用改进的像素覆盖分割方法给边界像素重新分配覆盖值;最后,运用活动轮廓算法进行细化的图像边界提取;分别进行了分割结果的定性比较,抗噪性测试以及提取的边缘对比实验。实验结果表明,该方法对具有模糊边界的图像,提取边缘结果优于其他可比文献中提出的方法。  相似文献   

5.
本文从数字图像处理角度出发,探讨了数字图像轮廓特征提取的一般过程,将原始图像进行灰度处理、平滑滤波、阈值分割、边缘检测等处理得到原始图像的二值黑白位图,提取出图像的轮廓特征.提取出来的特征可以用于进一步的图像识别、数学特征计算等研究,并给出常用方法下的提取过程和MATLAB环境下实现对照片中河流的提取.  相似文献   

6.
基于局部微分光流的运动对象分割   总被引:1,自引:1,他引:0  
雷震  吴玲达  李东 《计算机科学》2009,36(6):276-278
运动对象分割是研究从场景的图像序列或视频中提取出运动目标的理论和方法,是计算机视觉中一个重要的研究方向,在军事和工业等领域有着广阔的应用前景.提出一种基于局部微分光流的运动对象分割算法.首先采用局部微分光流算法计算出场景的运动光流场并完成其初始分割,然后利用canny算子探测出对象的边缘信息并将其作为对光流场得到的运动信息的补充,从而分割出更为准确的运动对象.实验结果显示该方法具有良好的分割性能.  相似文献   

7.
完全基于边缘信息的快速图像分割算法   总被引:2,自引:0,他引:2  
为快速准确地进行图像分割和对象提取,达到图像实时处理的要求,提出一种完全基于边缘信息、具有良好并行计算特性的图像分割和对象提取算法.首先对经典Canny算子边缘检测进行改进、引入了断点检测和递归可控的低阈值边缘追踪算法,得到图像的原始二值边缘图;然后采用基于断点的边缘连接算法得到待提取对象的完整闭合边缘;最后提出四向扫描区域填充算法从边缘图中完整地提取出有意义的对象.实验结果表明,文中算法不仅可以准确地处理图像中的各类复杂边缘、获得良好的图像分割效果,同时具有优秀的并行计算特性,可以以并行方式、基于GPU实现完全实时的图像处理.  相似文献   

8.
王锴  曾祥进  黎新  张锐  徐成 《工矿自动化》2023,(3):23-30+52
基于机器视觉的输送带跑偏检测方法检测的输送带边缘特征中包含伪边缘,现有研究难以识别伪边缘,且多场景适应性差。针对该问题,对输送带监控图像提取感兴趣区域(ROI)并进行归一化,采用较大阈值区间的Canny算法提取边缘特征点,以提高算法的场景适应性,并采用形态学滤波方法处理部分杂质及伪边缘;对于Canny算法无法检测到有效边缘的图像,对提取的ROI进行伽马变换和45,135°方向的梯度滤波,以增强边缘特征,之后进行基于Canny算法的特征点提取和形态学滤波。以边缘点像素值关系、邻域特征、紧密性特征,以及边缘线长度、相对位置、斜率等作为约束条件,采用基于分治搜索思想的直线筛选排序算法对提取的边缘特征点进行筛选及拟合,得到输送带实时边缘。将实时边缘的像素值与未发生跑偏时边缘像素值做差,得到当前跑偏的像素值。试验结果表明,针对多种场景下的输送带监控图像,基于Canny算法和直线筛选排序的输送带跑偏检测方法检测误差小于3个像素值,百张图像检测时间为6.945 1 s,边缘计算机处理4路视频图像的CPU占有率为132%,满足现场输送带边缘检测的准确性、实时性要求。  相似文献   

9.
区域分割算法可将图像中含有有效信息的区域挑选出来,由此提出一种基于图像融合的边缘提取方法,在区域分割的基础上,利用分水岭算法对分割出来的含有有效信息的区域进行边缘提取。并将所得结果与其他边缘提取算法融合,得到单像素宽的、封闭的轮廓。该方法可以降低背景区域对结果的影响,综合多种算法的优点。实验结果表明该方法稳定可靠,具有较强的实用性。  相似文献   

10.
传统的边缘检测算子仅在空域上对梯度图像进行阈值分割来计算二值边缘图像,当应用在自然场景图像中时,检测结果中往往含有大量的干扰边缘。为了消除干扰边缘,提高传统边缘算子的轮廓检测性能,提出了基于空频域联合阈值分割的轮廓检测方法:首先对梯度图像进行频域阈值分割消除干扰边缘,然后进行空域阈值分割得到最终的二值边缘图。结合Canny算子,利用自然场景图像对该方法进行了性能评估,结果表明,该方法大大减少了干扰边缘,有效提高了Canny算子在复杂自然场景图像中的轮廓检测性能。  相似文献   

11.
High user interaction capability of mobile devices can help improve the accuracy of mobile visual search systems. At query time, it is possible to capture multiple views of an object from different viewing angles and at different scales with the mobile device camera to obtain richer information about the object compared to a single view and hence return more accurate results. Motivated by this, we propose a new multi-view visual query model on multi-view object image databases for mobile visual search. Multi-view images of objects acquired by the mobile clients are processed and local features are sent to a server, which combines the query image representations with early/late fusion methods and returns the query results. We performed a comprehensive analysis of early and late fusion approaches using various similarity functions, on an existing single view and a new multi-view object image database. The experimental results show that multi-view search provides significantly better retrieval accuracy compared to traditional single view search.  相似文献   

12.
刘冬  秦瑞  陈曦  李庆 《计算机科学》2017,44(4):302-305
通过单应矩阵生成的鸟瞰视角全景图像存在严重的信息损失和边缘模糊形变。为三维空间点加入约束,将其限制在二维空间中,可以实现一幅图像从一个视角唯一变换另一视角。假设3D空间点来自于一个“包裹”车辆的曲面,使得原始摄像头图像上每一点对应的投影线都和曲面有交点,摄像头从不同角度观察曲面和车辆,便可生成多视角全景图像。针对相交区域也进行了特殊处理。最后的实验表明,生成的多视角的全景图像既可以充分利用原始图像信息从不同视角观测车辆周边场景,同时也减少了边缘模糊和扭曲,相交区域的过渡也显得更加自然、平滑。  相似文献   

13.
视觉归一化是多视点图像拼接领域的一个关键技术,在对大量图像处理算法研究的基础上,提出了一种针对多摄像机图像拼接的视觉归一化处理方法。该方法主要包括图像颜色校正和图像边缘融合两个模块;在图像颜色校正模块中,引入了图像区域划分策略和自适应颜色调节因子,使不同的像素点都有不同的颜色调节因子,并充分利用相邻图像间的颜色关联性对目标图像的颜色进行自适应校正;在图像边缘融合模块中,利用反映射矩阵计算出拼接图像的重叠区域,利用自适应边缘融合因子对重叠区域进行边缘融合处理。实验结果表明,该方法能够较好地减少甚至消除拼接图像间的视觉差异,较好地改善了图像拼接的视觉效果。  相似文献   

14.
双目立体测量中多视角深度图同时融合算法   总被引:2,自引:2,他引:0  
提出一种将多次测量得到的深度图数据融合生成完整单一的网格曲面来描述被测物体表面的融合算法.依次将每幅深度图作为基准图,在基准图的基础上定义多幅深度图重叠对应关系;然后合并重叠数据,保留基准图网格;最后将相邻的基准图通过网格缝合连接成单一无缝的曲面.该算法能同时对多幅深度图进行融合,通过对重叠区域的优化,使得最终融合结果更精确地逼近被测物体表面的真实数据.融合实验结果验证了该算法的有效性.  相似文献   

15.
目的 像方无人机影像多视匹配方法忽视了影像之间的几何关系,而以MVLL(multi-view vertical line locus)为代表的物方多视匹配方法缺乏对地形之间相互约束的考虑。为此构建一种融合两类多视匹配方法优点的无人机影像物方多视匹配算法。方法 在MVLL匹配结构的基础上添加半全局匹配的相容性约束,不仅继承了原半全局算法对有弱纹理区域匹配效果好和物体边缘突出的优点,而且摆脱了需制作核线影像的繁琐过程;采用物方窗口SNCC(summed normalized cross correlation)一致性匹配测度计算方法,有效降低摄影角度和遮挡对匹配结果的影响;采用金字塔分层的策略以提高匹配的速度和可靠性。结果 选取自主研制的旋翼无人机三轴稳定平台获取了高分辨率无人机影像作为实验数据,从匹配效果、新匹配测度性能和匹配精度3个方面对算法进行了测试实验。本文算法整体匹配效果良好,物方窗口SNCC一致性匹配测度可有效消除匹配测度中的粗差,经过测定本文匹配算法生成的点云数据的高程精度为0.049 m,即约为1个GSD(ground space resolution)对应的地面大小。结论 本文算法充分利用了无人机影像的多视信息进行匹配计算,具有匹配效果好、鲁棒性强和匹配精度高的优势。  相似文献   

16.
在多视点图像系统中,由于场景光照或相机标定的原因,通常会导致同一对象在不同视点位置颜色外表的不一致。传统的亮度补偿算法难以有效地解决这个问题。基于Retinex颜色恒常性理论,提出了一种新颖的多视点图像规正算法,通过直方图均衡化、Retinex处理和颜色恢复手段,提取出反映物体本质特征的反射光系数来消除不一致光照的影响,在增强单视点图像对比度的同时,将视点间图像的颜色规正到一致的水平。  相似文献   

17.
In multi-view reconstruction systems, the recovered point cloud often consists of numerous unwanted background points. We propose a graph-cut based method for automatically segmenting point clouds from multi-view reconstruction. Based on the observation that the object of interest is likely to be central to the intended multi-view images, our method requires no user interaction except two roughly estimated parameters of objects covering in the central area of images. The proposed segmentation process is carried out in two steps: first, we build a weighted graph whose nodes represent points and edges that connect each point to its k-nearest neighbors. The potentials of each point being object and background are estimated according to distances between its projections in images and the corresponding image centers. The pairwise potentials between each point and its neighbors are computed according to their positions, colors and normals. Graph-cut optimization is then used to find the initial binary segmentation of object and background points. Second, to refine the initial segmentation, Gaussian mixture models (GMMs) are created from the color and density features of points in object and background classes, respectively. The potentials of each point being object and background are re-calculated based on the learned GMMs. The graph is updated and the segmentation of point clouds is improved by graph-cut optimization. The second step is iterated until convergence. Our method requires no manual labeling points and employs available information of point clouds from multi-view systems. We test the approach on real-world data generated by multi-view reconstruction systems.  相似文献   

18.
3D video [IEEE Multimedia (1997) 18] is the ultimate image media recording dynamic visual events in the real world as is; it records time varying 3D object shape with high fidelity surface properties (i.e., color and texture). Its applications cover wide varieties of personal and social human activities: entertainment (e.g., 3D game and 3D TV), education (e.g., 3D animal picture books), sports (e.g., sport performance analysis), medicine (e.g., 3D surgery monitoring), culture (e.g., 3D archive of traditional dances), and so on. In this paper, we propose: (1) a PC cluster system for real-time reconstruction of dynamic 3D object action from multi-view video images, (2) a deformable 3D mesh model for reconstructing the accurate dynamic 3D object shape, and (3) an algorithm of rendering natural-looking texture on the 3D object surface from the multi-view video images. Experimental results with quantitative performance evaluations demonstrate the effectiveness of these methods in generating high fidelity 3D video from multi-view video images.  相似文献   

19.
卫星  李佳  孙晓  刘邵凡  陆阳 《自动化学报》2021,47(11):2623-2636
多视角图像生成即基于某个视角图像生成其他多个视角图像, 是多视角展示和虚拟现实目标建模等领域的基本问题, 已引起研究人员的广泛关注. 近年来, 生成对抗网络(Generative adversarial network, GAN)在多视角图像生成任务上取得了不错的成绩, 但目前的主流方法局限于固定领域, 很难迁移至其他场景, 且生成的图像存在模糊、失真等弊病. 为此本文提出了一种基于混合对抗生成网络的多视角图像生成模型ViewGAN, 它包括多个生成器和一个多类别判别器, 可灵活迁移至多视角生成的多个场景. 在ViewGAN中, 多个生成器被同时训练, 旨在生成不同视角的图像. 此外, 本文提出了一种基于蒙特卡洛搜索的惩罚机制来促使每个生成器生成高质量的图像, 使得每个生成器更专注于指定视角图像的生成. 在DeepFashion, Dayton, ICG Lab6数据集上的大量实验证明: 我们的模型在Inception score和Top-k accuracy上的性能优于目前的主流模型, 并且在结构相似性(Structural similarity, SSIM)上的分数提升了32.29%, 峰值信噪比(Peak signal-to-noise ratio, PSNR)分数提升了14.32%, SD (Sharpness difference)分数提升了10.18%.  相似文献   

20.
目的 在序列图像或多视角图像的目标分割中,传统的协同分割算法对复杂的多图像分割鲁棒性不强,而现有的深度学习算法在前景和背景存在较大歧义时容易导致目标分割错误和分割不一致。为此,提出一种基于深度特征的融合分割先验的多图像分割算法。方法 首先,为了使模型更好地学习复杂场景下多视角图像的细节特征,通过融合浅层网络高分辨率的细节特征来改进PSPNet-50网络模型,减小随着网络的加深导致空间信息的丢失对分割边缘细节的影响。然后通过交互分割算法获取一至两幅图像的分割先验,将少量分割先验融合到新的模型中,通过网络的再学习来解决前景/背景的分割歧义以及多图像的分割一致性。最后通过构建全连接条件随机场模型,将深度卷积神经网络的识别能力和全连接条件随机场优化的定位精度耦合在一起,更好地处理边界定位问题。结果 本文采用公共数据集的多图像集进行了分割测试。实验结果表明本文算法不但可以更好地分割出经过大量数据预训练过的目标类,而且对于没有预训练过的目标类,也能有效避免歧义的区域分割。本文算法不论是对前景与背景区别明显的较简单图像集,还是对前景与背景颜色相似的较复杂图像集,平均像素准确度(PA)和交并比(IOU)均大于95%。结论 本文算法对各种场景的多图像分割都具有较强的鲁棒性,同时通过融入少量先验,使模型更有效地区分目标与背景,获得了分割目标的一致性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号