首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
This study aims at automating the design of the image‐recognition algorithm and the image‐acquisition environment for an industrial picking system. Here for the image‐recognition algorithm, a preprocessing image parameter and a discriminator using local features in images are targeted. For the image‐acquisition environment, the camera distance from the target objects and the illumination strength of each RGB color are considered. The problem is formulated as an optimization problem, and a method is proposed to derive solutions using a two‐phase random multistart local optimization for the image‐acquisition environment and the image‐recognition algorithm. In addition, experiment‐based optimization is made to deal with the uncertainty of the capturing environment. Furthermore, positions and angles are considered in a robot coordinate system to simplify the image‐acquisition process. The three evaluation experiments targeting objects with different surface characteristics are conducted. The results show that the proposed system successfully designed parameter sets for the image‐acquisition environment and the image‐recognition algorithm that suited the characteristics of the target objects. The object recognition rate, that is, F measure , is 1 for all objects in all the three experiments.  相似文献   

2.
一种基于支持向量机的三维物体识别方法   总被引:5,自引:1,他引:4  
提出从三维物体的二维图像中提取仿射不变傅氏描述子、色彩矩及纹理特征,组成一个25维的特征向量,送入支持向量机训练并用于三维物体识别。算法利用了仿射不变傅氏描述子在物体发生仿射形变时具有不变性,利用色彩矩和纹理特征区分形状相似但有不同颜色及纹理的物体,并引入支持向量机作为分类器。基于三维物体图像数据库COIL-100测试了算法的识别性能。当每个物体训练样本图像数量为36个(视角间隔10°)时达到了100%的识别率,进一步减少训练视角数量也达到较满意的识别性能。  相似文献   

3.
电力设备铭牌包含丰富的设备信息,通过图文识别技术获取设备铭牌信息,可更加高效快捷地完成电力设备的信息统计、台帐校核等工作,也有利于提高电力系统的设备管理水平。针对电力设备铭牌与普通图像文本识别差异较大的特殊应用场景,文中提出一种基于深度学习的电力设备铭牌信息自动识别算法。该算法由铭牌检测、文本检测、文本识别三部分组成。通过改进损失函数设计、增加文本识别结果纠正、人工合成文本图像等方式,使得铭牌检测模型在测试集上的平均精度均值达到92.2%,文本检测模型在测试集上的F1值达到91.2%,文本识别模型的字符识别准确率达到94.0%,文本行识别准确率达到82.3%。  相似文献   

4.
针对电气设备红外图像中需要对目标进行识别和诊断的需求,提出了一种基于元胞自动机(CA)与最大类间方差(OTSU)法的图像增强与分割算法.首先采用高帽、低帽变换结合的方法对电气设备红外图像进行增强,时增强后的图像采用CA法进行边缘提取,并进行二值化处理,最后与经过OTSU算法分割后的红外图像进行融合.实验结果表明采用该算...  相似文献   

5.
手势识别是人机交互的重要手段.为了精确识别手势并摒除光照等环境干扰,同时减除由于手部高维运动造成的关键点剧烈抖动的问题,提出一种基于基于蒙版区域的卷积神经网络(Mask Region-based convolutional neural network,Mask R-CNN)与多项式平滑算法(Savitzky-Golay,SG)的手势关键点提取方法.该方法首先对输入的红绿蓝(RGB)三通道图像进行特征提取与区域分割,获得手部的实例分割与掩码.然后利用ROIAling及功能性网络进行目标匹配,标记出22个关键点(21个骨骼点+1个背景点).将标记后结果送入SG滤波器进行数据平滑,并进行骨骼点的重新标定.从而得到稳定的手势提取特征.对模型进行对比实验,结果表明,该方法能够最大程度摒除环境干扰,并精准提取关键点.与传统基于轮廓分割的手势关键点提取相比,模型的鲁棒性大大提高,识别精度达到93.48%.  相似文献   

6.
煤灰熔融性图像自动识别算法的研究   总被引:1,自引:0,他引:1  
本文提出了一种测定煤灰熔融性时图像的自动识别的算法。根据模式识别和计算机视觉理论,首先从CCD摄像机处采集图像,经过预处理后,采用阈值迭代和Otsu分割算法相结合的单阈值法进行图像分割,在定位灰锥目标区域后,进一步提取高度、底宽和面积等几何特征,作为特征温度图像的识别依据。实验表明,该算法简单、有效,且能兼顾系统的实时性和准确性要求。  相似文献   

7.
针对基于ViT模型的细粒度图像识别算法存在特征提取不全面、参数选取不具普适性等问题,提出一种融合间接注意力的自适应特征提取方法(Adaptive Feature Extraction with Indirect Attention,AFEIA)。首先,对于目标对象的特征提取,采用改进后的自然断点分类算法将特征分为最相关、次相关、不相关三种,对不同的输入样本可以自适应地提取最具辨别性特征,保证了特征提取的准确性;然后,利用注意力权重矩阵,获取被忽略特征中与目标对象间接相关的特征,以获取各对象之间细微的差异,保证了特征提取的全面性。实验表明,使用AFEIA方法的ViT模型在两个细粒度数据集CUB-200-2011、Stanford Dogs上分别达到91.6%、91.5%的预测准确率,通过可视化方法和消融实验,验证了AFEIA方法的有效性。  相似文献   

8.
一种坦克装甲车识别方法   总被引:2,自引:0,他引:2  
坦克装甲车识别在军事图像处理方面具有重要的意义,对于实现对地面目标进行精确打击具有重要的实际用途.本文主要围绕复杂背景中目标图像区域识别方法进行了深入研究,重点阐述了图像二值化迭代选择阈值法、图像特征提取的目标区域Zernike矩计算法、图像分类识别的神经网络技术等重点技术,介绍了一种行之有效的识别方法,实现了在包含地面军事战术目标初始图像中对坦克装甲车区域的较准确识别.通过对近百幅坦克、装甲车等图像的试验测试,识别率达到了95%.  相似文献   

9.
提出了一种基于SSE指令集的运动目标识别与跟踪系统的设计方案,重点论述了该方案中图像处理的过程及算法,包括颜色模型的选择、图像的预处理、图像取差目标识别、多线程并行处理、SSE指令集及自动跟踪控制几个部分。实践证明,该系统提升了图像识别的精度和速度。目前,该系统已成功应用于激光照射精度测试试验任务中,这对于分析导弹的命中精度和制导误差、实现实弹飞行试验中的故障诊断都具有十分重要的意义。  相似文献   

10.
The recognition of cursive handwritten texts is a complex, in some cases unsolvable, task. One problem is that in most cases it is difficult or impossible to identify each letter, even if the words are separated. In our new method, the identification of letters is not needed due to the extensive and iterative use of semantic and morphological information of a given language. We are using a spatial feature code, generated by a cellular nonlinear network (CNN) based cellular wave computer algorithm, and combine it with the linguistic properties of the given language. Most general‐purpose handwriting recognition systems lack the ability to integrate linguistic background knowledge because they use it only for post‐processing recognition results. The high‐level a priori background knowledge is, however, crucial in human reading and similarly it can boost recognition rates dramatically in case of recognition systems. In our new system we do not treat the visual source as the only input: geometric and linguistic information are given equal importance. On the geometric side we use word‐level holistic feature detection without letter segmentation by analogic CNN algorithms designed for cellular wave computers (IEEE Trans. Circuits Syst. 1993; 40 :163–173; Cellular Neural Networks and Visual Computing, Foundations and Applications. Cambridge University Press: Cambridge, U.K., New York, 2002). The linguistic side is based on a morpho‐syntactic linguistic system (Proceedings of COLING‐2002, vol. II, Taipei, Taiwan, 2002; 1263–1267). A novel shape coding method is used to interface them, and their interaction is enhanced via an inverse filtering technique based on features that are global or of a low confidence value. A statistical context selection method is also applied to further reduce the output word lists. Copyright © 2008 John Wiley & Sons, Ltd.  相似文献   

11.
针对电力线异物识别模型能使用的数据集较少,并且传统单幅自然图像的生成式模型(SinGAN)模型生成数据与异物识别模型匹配度不高、质量不佳、耗时过久的问题,提出了改进SinGAN模型。在改进SinGAN模型基础上加入仿射变换单元、大小变换单元进一步增强数据集,加入图像滤波单元提高电力线异物识别模型所需数据质量。并通过改进SinGAN反向传播训练过程和SinGAN的单精度生成器结构提升模型生成质量,减少所用时长。实验结果表明,经50次实验后,改进SinGAN的平均弗雷谢特起始距离(Fréchet inception distance, FID)为91.375,平均训练时长1.21 h。分别比传统SinGAN降低了27.247%和87.31%。改进SinGAN与其他主流生成式对抗网络相比有更好的异物数据生成能力,可以增强电力线异物识别模型所需数据,具有优越性。  相似文献   

12.
图像识别技术在换流站监控系统中的应用   总被引:1,自引:0,他引:1  
针对换流站视频监控系统现状,提出几种以图像识别技术为基础的报警机制:故障检测报警机制主要识别对象为设备;安全防盗报警机制主要识别对象为人;自然灾害报警机制主要识别对象为整体环境。介绍了图像识别技术的原理和具体识别过程及方法,指出图像识别技术融入换流站监控系统的研究在我国还处于起步阶段,具有广阔的应用前景。  相似文献   

13.
目标自动识别与跟踪是跟踪系统中的关键技术.在坦克的目标自动跟踪系统中,由于摄像仪安装在运动载体上,其拍摄的图像背景相对于摄像仪是运动的,从运动背景中检测出其中的运动目标难度较高.本文将目标分为对地目标与对空目标2种类型,并根据目标类型的不同特征,分别采用SSDA和以图像矩为特征值的相关跟踪方法来识别.实验结果表明,该方法可以较好地自动识别与跟踪运动目标.  相似文献   

14.
为了提高机器人在复杂的室内环境中场景识别的准确率,本文提出一种融合卷积神经网络(convolutional neural network, CNN)和视觉Transformer结构的机器人室内场景识别模型。本文模型利用CNN提取场景局部特征,然后使用视觉Transformer结构捕捉特征中远距离依赖关系,其中提出的视觉Transformer结构包括3个部分,分别是特征编码结构(Attention Embedding)、Encoder结构和一个将高层语义特征转化成像素级特征的结构(Attention Project)。本文研究的机器人场景识别模型利用CNN提高视觉Transformer局部细节特征的描述能力,同时通过视觉Transformer帮助CNN构建远距离特征的依赖关系,从而能够有效的表征和利用机器人工作场景图像的视觉特征。最后,通过机器人在实际工作环境中采集的数据集和开源的COLD数据集进行实验,验证了本文研究模型的有效性,场景识别精度更高。  相似文献   

15.
为了解决现有手势识别易受背景噪声干扰和算法较为复杂的问题,提出一种基于3D视觉的数字手势语义识别方法。首先,通过RealSense 3D相机采集手部区域的RGB图像和深度图像,并结合深度信息和肤色信息,对手势进行分割;其次,对手势图像进行形态学滤波后,得到手势区域的轮廓凸包面积比、凸缺陷数、手指夹角和关键点连线比值等特征参数;最后,通过分析不同手势独有的特征参数,实现准确的手势识别。对数字0~9的手势分别进行50次识别实验,手势分割准确率为100%,手势识别准确率为98.5%。实验表明该方法准确可靠,数字手势识别效果理想。  相似文献   

16.
行人特征提取是行人识别中关键步骤之一。传统的做法是分别从彩色图像的每个颜色通道(即R、G、B通道)中提取特征描述子(如方向梯度直方图(HOG)、局部二值模式(LBP)等),最后合并成一个特征向量。传统方法不足之处在于难以兼顾不同颜色通道之间的关联信息。为此,采用四元局部排序二值模式(QLRBP)运算方法从彩色图像中提取局部特征描述子。与传统方法不同的是,该方法是一种整体的方法,是在彩色图像的四元数表示空间而非3个颜色通道中分别提取LBP特征。首先,将从车载摄像头中采集的彩色图像通过四元数转换获得其四元数表示;然后,对四元数空间中图像进行CTQ变换,并计算变换后的图像相位;最后,在每个四元数相位上进行LBP运算,并生成行人彩色图像的局部特征描述子。QLRBP能够同时处理所有的颜色通道,因此能够同时包含三通道之间的关系。在行人判定方法上,本文首先提取所有正负样本的QLRBP特征,并使用K-最近邻(K-NN)算法训练分类器。在INRIA数据库上测试表明,QLRBP描述子对于彩色行人的检测比其他常用的特征描述子(如HOG特征,LBP特征)具有更高的精确度,性能接近当前先进的行人识别方法。  相似文献   

17.
针对电力线巡线异物检测使用的传统卷积神经网络空间辨识度较差、训练样本需求过多的问题,提出一种改进胶囊网 络模型。 使用数据灰度化、三维块匹配滤波算法预处理巡线数据集。 提出自适应贡献池化降低数据信息丢失量,异物数据深度 信息提取单元提取主要特征来滤除冗余信息、减少数据数量以改善模型性能,改进异物识别主胶囊层和动态路由结构以适应电 力线巡线异物检测的二分类情况。 对自适应贡献池化和最大池化,无池化、传统结构胶囊网络和改进胶囊网络,改进胶囊网络 和 AlexNet、GoogLeNet 分别进行异物识别对比实验和改进胶囊网络的空间辨识度性能进行测试实验。 实验结果表明,在 3 700 张小训练样本条件下,经 20 次训练后,自适应贡献池化比最大池化的改进胶囊网络平均准确率提高 2. 7%,改进胶囊网络比无 池化、传统结构胶囊网络平均准确率提高 3. 6%,改进胶囊网络比 AlexNet、GoogLeNet 的平均准确率分别提高 21. 9%和 12. 6%, 且改进胶囊网络在大小、角度不同的测试数据中仍具有高于 91%的平均准确率。 改进胶囊网络在空间辨识度复杂、少训练样本 情况下仍具有较高的异物识别能力,实现了高效率、高准确率的自动化无人巡线异物检测。  相似文献   

18.
To tackle the divergence of the classical particle filter method for multiple object tracking in image sequences, a new particle filter, called pseudoparticle filter (PPF), is proposed. The PPF invokes subset particles of generic particle filters to form a continuous estimate of the posterior density function of the objects. After sampling-importance resampling (SIR), the subset particles converge to the observations. It is proved that, using an appropriate kernel function of the mean shift algorithm, we can get the subset particles of the observations and the fixed points of clustering results as the state of the objects. A multiple object data association and state estimation technique is proposed to resolve the subset particles correspondence ambiguities that arise when multiple objects are present. Experimental results demonstrate the efficiency and effectiveness of the algorithm for single and multiple object tracking. __________ Translated from Journal of Xidian University, 2008, 35(2): 248–253 [译自: 西安电子科技大学学报(自然科学版)]  相似文献   

19.
节能减排目标下燃煤机组电量分配模糊优化模型   总被引:1,自引:1,他引:0  
谭忠富  于超 《电网技术》2012,36(1):219-223
电力工业是节能减排的重点行业,"以大代小"成为电力行业节能减排和结构调整的重要手段。以煤耗量和二氧化碳排放量最小为目标,建立节能减排下燃煤火电机组电量分配优化模型,并通过定义目标隶属度函数将目标模糊化,采用满意度指标将双目标问题转化为单目标问题进行求解。算例分析表明:建立的优化模型能够在满足煤耗和排放量最小的目标下合理分配机组发电量;相比计划电量分配模式,节能减排模式下100 MW及以下煤耗高、污染重的小机组被分配电量减少、煤耗低、污染小的大机组被分配电量增多。通过与单目标模型比较,该双目标优化模型可以更好地兼顾到煤耗和排放目标的统一,为电力节能减排政策制定提供更准确的定量分析依据。  相似文献   

20.
交通监控系统中车辆和行人的检测与识别   总被引:3,自引:0,他引:3  
本文提出一种应用于智能交通监控系统的车辆和行人的检测和识别方法.首先结合帧间差分,对交通监控场景的视频图像序列建立动态背景模型,然后用背景消除法对监控视频中的运动目标进行有效检测,提取出运动目标的轮廓.最后采用支持向量机,对检测出运动目标进行快速识别.实验结果表明,该方法能够快速准确地在监控视频中对运动的车辆和行人进行检测和分类识别,对快速交通通道中非法行人入侵进行自动报警.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号