首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
图片相似度比对作为计算机视觉的一个研究方向, 具有广泛的应用前景, 例如人脸识别、行人重识别和目标跟踪等. 然而, 目前有关图片相似度算法的总结和归纳相对较少, 并且将其应用在实际工业生产中也存在挑战. 本文总结了传统图像处理算法和深度学习图像处理算法在图片相似度比对方面的原理与表现, 旨在选取最佳的算法用于药品图片相似度比对的场景中. 在传统图像处理算法中, ORB算法在测试集上表现最佳, 准确率为93.09%; 在深度学习算法中, 采用改进的孪生网络结构、发明了一种标签生成法、设置特定的数据增强策略并增加一个特征面分类网络, 从而提高了训练效率和准确率. 最终的测试结果显示, 改进的孪生网络表现最佳, 可以实现98.56%的准确率和27.80次/s的推理速度. 综上所述, 采用改进的孪生网络算法更适用于药品图片的快速比对, 并且有望在未来的医药行业中得到广泛应用.  相似文献   

2.
在各种灾害中,火灾是最经常、最普遍的威胁公众安全和社会发展的主要灾害之一。随着经济建设的迅猛发展,城市规模日趋扩大,重大火灾隐患急剧增加。然而,目前广泛使用的烟雾传感器探测火灾的方法,易受距离等因素影响,导致检测不及时。视频监控系统的引入为解决这一问题提供了新思路,基于视频的传统图像处理算法是较早提出的方法,最近机器视觉与图像处理技术快速发展,涌现出一系列使用深度学习技术来自动检测视频和图像中火灾的方法,在消防安全领域具有非常重要的实际应用价值。为了综合分析火灾检测的深度学习方法相关改进及应用,简要介绍了基于深度学习的火灾检测流程,重点从分类、检测、分割3个粒度对火灾检测的深度方法详细对比分析,阐述每类算法针对现有问题采取的相关改进。总结现阶段火灾检测存在的问题,并提出未来的研究方向。  相似文献   

3.
计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会"看",是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人工神经网络特征学习能力不强、生物可解释性不足,而深层神经网络存在过拟合、高功耗的缺点,因此在低功耗环境下具有生物可解释性的图像分类算法研究仍然是一个具有挑战性的任务。为了解决上述问题,结合脉冲神经网络,设计并实现了一种基于Jetson TK1和脉冲神经网络的图像分类算法。研究的主要创新点有:(1)设计了深度脉冲卷积神经网络算法,用于图像分类;(2)实现了基于CUDA改进的脉冲神经网络模型,并部署在Jetson TK1开发环境上。  相似文献   

4.
水下光学图像可以提供直观丰富的海洋信息,近年来在海洋资源开发、环境保护和海洋工程等诸多领域发挥越来越重要的作用。但是受恶劣复杂的水下成像环境影响,水下光学图像普遍存在对比度低、图像模糊以及颜色失真等质量退化问题,严重制约水下智能处理系统的性能和应用。如何清晰地重建水下光学图像是国内外广泛关注的、具有挑战性的难点问题。随着深度学习技术的蓬勃发展,利用深度学习来提升水下图像质量成为当前的研究热点。鉴于目前国内在水下光学图像重建方面的研究综述较少,本文全面综述其研究进展。分析了水下图像退化机理,总结了现有水下成像模型以及水下图像重建的挑战;梳理了水下光学图像重建方法的发展历程,根据是否采用深度学习以及是否基于成像模型,将现有方法分为4大类,并按照研究发展顺序,依次介绍4类方法的基本思想,分析其优缺点;归纳了目前公开的水下图像数据集以及常用的水下图像质量评价方法,并对8种典型的水下图像重建方法进行了性能评测和对比分析;总结了该领域目前仍存在的问题,展望了后续研究方向,以便于相关研究人员了解该领域的研究现状,促进该领域的技术发展。  相似文献   

5.
基于计算机视觉的果实目标检测识别是目标检测、计算机视觉、农业机器人等多学科的重要交叉研究课题,在智慧农业、农业现代化、自动采摘机器人等领域,具有重要的理论研究意义和实际应用价值。随着深度学习在图像处理领域中广泛应用并取得良好效果,计算机视觉技术结合深度学习方法的果实目标检测识别算法逐渐成为主流。本文介绍基于计算机视觉的果实目标检测识别的任务、难点和发展现状,以及2类基于深度学习方法的果实目标检测识别算法,最后介绍用于算法模型训练学习的公开数据集与评价模型性能的评价指标,且对当前果实目标检测识别存在的问题和未来可能的发展方向进行讨论。  相似文献   

6.
机器学习在计算机视觉、语音识别和自然语言处理等实际应用中已经取得了显著的成功。图像分类作为计算机视觉的一个主要分支。不久的将来,许多的图像分类程序会以机器学习的方式呈现。然而,由于机器学习图像分类程序的测试面临着测试预言难题,这使得在测试的过程中将需要大量的人力及物力。为了缓解测试预言难题,使用了蜕变测试技术。为了规范测试流程、提高测试效率,提出了一种适用于机器学习图像分类程序的蜕变测试框架。并且通过测试基于SVM和VGGNet图像分类程序,验证了该测试框架的合理性和有效性。  相似文献   

7.
丁光耀  徐辰  钱卫宁  周傲英 《软件学报》2024,35(3):1207-1230
计算机视觉因其强大的学习能力,在各种真实场景中得到了广泛应用.随着数据库的发展,利用数据库中成熟的数据管理技术来处理视觉分析应用,已成为一种日益增长的研究趋势.图像、视频和文本等多模态数据的相互融合处理,也促进了视觉分析应用的多样性和准确性.近年来,因深度学习的兴起,支持深度学习的视觉分析应用开始受到广泛关注.然而,传统的数据库管理技术在深度学习场景下面临着复杂视觉分析语义难以表达、应用执行效率低等问题.因此,支持深度学习的视觉数据库管理系统得到了广泛关注.综述了目前视觉数据库管理系统的研究进展:首先,总结了视觉数据库管理系统在不同层面上面临的挑战,包括编程接口、查询优化、执行调度和数据存储;其次,分别探讨了上述4个层面上的相关技术;最后,对视觉数据库管理系统未来的研究方向进行了展望.  相似文献   

8.
While artificial vision prostheses are quickly becoming a reality, actual testing time with visual prosthesis carriers is at a premium. Moreover, it is helpful to have a more realistic functional approximation of a blind subject. Instead of a normal subject with a healthy retina looking at a low-resolution (pixelated) image on a computer monitor or head-mounted display, a more realistic approximation is achieved by employing a subject-independent mobile robotic platform that uses a pixelated view as its sole visual input for navigation purposes. We introduce CYCLOPS: an AWD, remote controllable, mobile robotic platform that serves as a testbed for real-time image processing and autonomous navigation systems for the purpose of enhancing the visual experience afforded by visual prosthesis carriers. Complete with wireless Internet connectivity and a fully articulated digital camera with wireless video link, CYCLOPS supports both interactive tele-commanding via joystick, and autonomous self-commanding. Due to its onboard computing capabilities and extended battery life, CYCLOPS can perform complex and numerically intensive calculations, such as image processing and autonomous navigation algorithms, in addition to interfacing to additional sensors. Its Internet connectivity renders CYCLOPS a worldwide accessible testbed for researchers in the field of artificial vision systems. CYCLOPS enables subject-independent evaluation and validation of image processing and autonomous navigation systems with respect to the utility and efficiency of supporting and enhancing visual prostheses, while potentially reducing to a necessary minimum the need for valuable testing time with actual visual prosthesis carriers.  相似文献   

9.
作为计算机视觉领域的基本问题之一, 目标追踪具有广泛的应用场景. 随着硬件算力和深度学习方法的进步, 常规的深度学习目标追踪方法精度越来越高, 但其模型参数量庞大, 计算资源和能耗需求高. 近年来, 随着无人机和智能物联网应用的蓬勃发展, 如何在存储空间和算力有限、低功耗需求的嵌入式硬件环境中进行实时目标跟踪, 成为当前研究的热点. 本文对面向嵌入式应用的目标追踪方法进行了分析综述, 包括相关滤波结合深度学习的目标追踪方法、基于轻量神经网络的目标跟踪方法, 并总结了深度学习模型部署流程和无人机等领域的嵌入式目标追踪典型应用实例, 最后对未来研究重点进行了展望.  相似文献   

10.
《Micro, IEEE》1990,10(6)
An overview is given of Pygmalion, which aims to promote European industry's application of neural networks and develop `standard' computational tools for their programming and simulation. A complete environment for developing algorithms and applications will demonstrate the network capabilities expected from their properties of massive parallelism, fault tolerance, adaptivity, and learning. Key real-world applications in image processing and speech processing and a small application in acoustic signals were selected to demonstrate the potential of neural networks for various industrial problems. In image processing, remote data sensing and factory inspection were investigated. In speech processing, the foundations were laid for an automatic speech recognition system by developing efficient learning algorithms for the basic building blocks  相似文献   

11.
车辆目标检测是基于计算机视觉的目标检测领域的一个重要应用领域,近年来随着深度学习在图像分类方面取得的巨大进展,机器视觉技术结合深度学习方法的车辆目标检测算法逐渐成为该领域的研究重点和热点。介绍了基于机器视觉的车辆目标检测的任务、难点与发展现状,以及深度学习方法中几种具有代表性的卷积神经网络模型,通过这些网络模型衍生出的two stage、one stage车辆目标检测算法和用于模型训练的相关数据集与检测效果评价标准,对其存在的问题及未来可能的发展方向进行了讨论。  相似文献   

12.
计算机视觉在智能制造工业检测中发挥着检测识别和定位分析的重要作用,为提高工业检测的检测速率和准确率以及智能自动化程度做出了巨大的贡献。然而计算机视觉在应用过程中一直存在技术应用难点,其中3大瓶颈问题是:计算机视觉应用易受光照影响、样本数据难以支持深度学习、先验知识难以加入演化算法。这些瓶颈问题使得计算机视觉在智能制造中的应用无法发挥最佳效能。因此,需要系统地加以分析和解决。本文总结了智能制造和计算机视觉的概念及其重要性,分析了计算机视觉在智能制造工业检测领域的发展现状和需求。针对计算机视觉应用存在的3大瓶颈问题总结分析了问题现状和已有解决方法。经过深入分析发现:针对受光照影响大的问题,可以通过算法和图像采集两个环节解决;针对样本数据难以支持深度学习的问题,可以通过小样本数据处理算法和样本数量分布平衡方法解决;针对先验知识难以加入演化算法的问题,可以通过机器学习和强化学习解决。上述解决方案中的方法不尽相同,各有优劣,需要结合智能制造中具体应用研究和改进。  相似文献   

13.
与传统工业机械臂相比,桌面型机械臂具有环境多变、人机协作等特点,为其增加视觉功能显得尤为重要。而目前实现机器视觉的应用框架有很多,如何根据机械臂工作环境及性质,搭建合适的视觉应用软硬件平台,以提高机器视觉识别的准确率和效率是本文研究的重点。本文通过采用TensorFlow深度学习框架,利用嵌入式系统的软硬件设计,结合OpenCV等图像处理软件,搭建适合桌面型机械臂的机器视觉二次开发框架,为进一步开发基于视觉的机械臂应用提供了基础。仿真测试及人机协作的案例应用表明该框架具有较好的适应性和高效性。  相似文献   

14.
沙浩  刘越 《图学学报》2021,42(3):385-397
真实世界的外观主要取决于场景内对象的几何形状、表面材质及光照的方向和强度等图像的本 征属性。通过二维图像预测本征属性是计算机视觉和图形学中的经典问题,对于图像三维重建、增强现实等应 用具有重要意义。然而二维图像的本征属性预测是一个高维的、不适定的逆向问题,通过传统算法无法得到理 想结果。针对近年来随着深度学习在二维图像处理各个方面的应用,出现的大量利用深度学习对图像本征属性 进行预测的研究成果,首先介绍了基于深度学习的图像本征属性预测算法框架,分析了以获得场景反射率和阴 影图为主的本征图像预测、以获得图像中材质 BRDF 参数为主的本征属性预测及以获得图像光照相关信息为主 的本征属性预测 3 个方向的国内外研究进展并总结了各自方法的优缺点,最后指出了图像本征属性预测的研究 趋势和重点。  相似文献   

15.
近年来深度学习在图像、语音、自然语言处理等诸多领域得到广泛应用,但随着人们对深度学习的训练速度和数据处理能力的需求不断提升,传统的基于单机的训练过程愈发难以满足要求,分布式的深度学习训练方法成为持续提升算力的有效途径其中训练过程中节点间网络的通信性能至关重要,直接影响训练性能分析了分布式深度学习中的性能瓶颈,在此基础上...  相似文献   

16.
对于激光视觉焊缝跟踪系统,基于线性结构光快速、高精度地提取焊缝特征点是系统搭建的关键。现有算法多是采取像素级别的提取特征,现提出改进的亚像素精度算法用以提取焊缝特征点。与以往算法不同的是,算法不需要进行阈值的选取,提取条纹中心线和检测特征点的过程,都采用了先计算出亚像素位置,再对图像进行处理,显著地提高了算法的精度。并且目前图像处理多采用深度学习,但都为对像素的离散点实现,难以做到亚像素精度。实验结果表明,该算法能够满足生产实际要求,能够实时、精确地实现焊缝提取。  相似文献   

17.
梁潇  李原  梁自泽  侯增广  徐德  谭民 《机器人》2007,29(5):0-450
近年来视觉传感器在工业自动化和机器人导航领域得到越来越多的应用。本文提出了一种基于DSP微处理器的视觉传感器的设计与实现。视觉传感器采集环境图像并在DSP内核处理器执行图像处理算法,得到决策结果后直接输出给控制系统执行,从而避免了传输大量图像数据所需要的高带宽通讯通道的使用。开发的视觉传感器具有体积小、实时性能好、可扩展性强等特点,并且提供了常用的图像处理软件支持包。文中对系统的软件和硬件开发进行了详细阐述,最后在焊缝自动跟踪平台上的应用验证了传感器的实际整体性能可满足实际应用的需要。关于视觉传感器的下一步工作在最后进行了讨论。  相似文献   

18.
机器视觉应用中的图像数据增广综述   总被引:1,自引:0,他引:1  
深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障.收集和准确标注图像数据集是一个极其费时且代价昂贵的过程.随着机器视觉的广泛应用,这个问题将会越来越突出.图像增广技术是一种有效解决深度学习在少量或者低质量训练数据中进行训练的一种技术手段,该技术不断地伴随着深度学习与机器...  相似文献   

19.
Super-resolution (SR) is a long-standing problem in image processing and computer vision and has attracted great attention from researchers over the decades. The main concept of SR is to reconstruct images from low-resolution (LR) to high-resolution (HR).It is an ongoing process in image technology, through up-sampling, de-blurring, and de-noising. Convolution neural network (CNN) has been widely used to enhance the resolution of images in recent years. Several alternative methods use deep learning to improve the progress of image super-resolution based on CNN. Here, we review the recent findings of single image super-resolution using deep learning with an emphasis on distillation knowledge used to enhance image super-resolution., it is also to highlight the potential applications of image super-resolution in security monitoring, medical diagnosis, microscopy image processing, satellite remote sensing, communication transmission, the digital multimedia industry and video enhancement. Finally, we present the challenges and assess future trends in super-resolution based on deep learning.  相似文献   

20.
雨天会影响室外图像捕捉的质量,进而引起户外视觉任务性能下降。基于深度学习的单幅图像去雨研究因算法性能优越而引起了大家的关注,并且聚焦点集中在数据集的质量、图像去雨方法、单幅图像去雨后续高层任务的研究和性能评价指标等方面。为了方便研究者快速全面了解该领域,本文从上述4个方面综述了基于深度学习的单幅图像去雨的主流文献。依据数据集的构建方式将雨图数据集分为4类:基于背景雨层简单加和、背景雨层复杂融合、生成对抗网络 (generative adversarial network,GAN)数据驱动合成的数据集,以及半自动化采集的真实数据集。依据任务场景、采取的学习机制以及网络设计对主流算法分类总结。综述了面向单任务和联合任务的去雨算法,单任务即雨滴、雨纹、雨雾和暴雨的去除;联合任务即雨滴和雨纹、所有噪声去除。综述了学习机制和网络构建方式(比如:卷积神经网络 (convolutional neural network,CNN)结构多分支组合,GAN的生成结构,循环和多阶段结构,多尺度结构,编解码结构,基于注意力,基于Transformer)以及数据模型双驱动的构建方式。综述了单幅图像去雨后续高层任务的研究文献和图像去雨算法性能的评价指标。通过合成数据集和真实数据集上的综合实验对比,证实了领域知识隐式引导网络构建可以有效提升算法性能,领域知识显式引导正则化网络的学习有潜力进一步提升算法的泛化性。最后,指出单幅图像去雨工作目前面临的挑战和未来的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号