首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
现有无监督特征学习算法通常在RGB色彩空间进行特征提取,而图像和视频压缩编码标准则广泛采用YUV色彩空间。为了利用人类视觉特性和避免色彩空间转换所消耗的计算量,该文提出一种基于稀疏自动编码器在YUV色彩空间进行无监督特征学习的方法。首先在YUV空间随机采集图像子块并进行白化处理,然后利用稀疏自动编码器进行无监督局部特征学习。在预处理阶段,针对YUV空间亮度和色度通道相互独立的特性,提出一种将亮度和色度进行分离的白化措施。最后用学习到的局部特征在大尺寸图像上进行卷积操作从而获得全局特征,并送入图像分类系统进行性能测试。实验结果表明:只要对亮度分量进行适当的白化处理,在YUV空间中的无监督特征学习就能够获得相当于甚至优于RGB空间的彩色图像分类性能。  相似文献   

2.
为了将无监督特征学习应用于小样本量的图像情绪语义分析,该文采用一种基于卷积稀疏自动编码器进行自学习的领域适应方法对少量有标记抽象图像进行情绪性分类。并且提出了一种采用平均梯度准则对自动编码器所学权重进行排序的方法,用于对基于不同领域的特征学习结果进行直观比较。首先在源领域中的大量无标记图像上随机采集图像子块并利用稀疏自动编码器学习局部特征,然后将对应不同特征的权重矩阵按照每个矩阵在3个色彩通道上的平均梯度中的最小值进行排序。最后采用包含池化层的卷积神经网络提取目标领域有标记图像样本的全局特征响应,并送入逻辑回归模型进行情绪性分类。实验结果表明基于自学习的领域适应可以为无监督特征学习在有限样本目标领域上的应用提供训练数据,而且采用稀疏自动编码器的跨领域特征学习能在有限数量抽象图像情绪语义分析中获得比底层视觉特征更优秀的辨识效果。  相似文献   

3.
随着互联网的迅速发展,网摘络上产生了大量的近重复视频,要如何快速精确地检测出这些近重复视频成为研究的热点。本文提出了一种基于稀疏自动编码器的视频特征提取模型,用于近重复视频检索。先用稀疏自动编码器提取视频关键帧的特征,然后根据视频间匹配的关键帧数占视频所有关键帧数的比例来度量视频的相似性。实验结果表明所提出的方法取得了较好的检索精度。  相似文献   

4.
深度自动编码与Q学习针对移动机器人路径规划的方法提供了全新的思路,利用神经网络的自适应能力,应用梯度下降法等算法计算权值与权重,实现对移动机器人的路径规划。移动机器人通过算法实现的初始化与卷积训练可以使机器人具备较强的交互能力,基于二者建造的移动机器人模型具有良好的并行性、容错性,同时能较快地处理高维数的数据,从而为移动机器人的路径规划贡献力量。  相似文献   

5.
针对深度学习下的图像识别技术,研究了图像识别和卷积神经网络的工作原理。分析了AlexNet模型、ResNet模型、MobileNet模型的卷积神经网络模型,以及三种算法模型的各自特点,实现了深度学习环境的搭建,通过实验对比三个模型的分类准确率和训练效率,为深度学习下的图像识别算法研究提供参考。  相似文献   

6.
针对一类置换区域含噪声的置换混叠图像,提出一种基于稀疏自动编码器的算法来自动检测和分离含噪声的置换区域。对含噪声的置换混叠图像进行分块,获取输入数据集。构建稀疏自动编码器网络,通过数据集训练参数,获得解码后的置换混叠图像。将解码后图像与原置换混叠图像作差运算得到差图像,通过检测差图像来确定置换区域,采用自适应阈值化操作分离出含噪声的置换区域,实现对置换区域的自动检测和分离。实验结果表明,采用本算法在置换区域位置、大小、个数和所含噪声类型、大小均未知的情况下,能有效地分离出含噪声的置换区域。   相似文献   

7.

多元医学信号的典型代表有多模态睡眠图和多通道脑电图等,采用无监督深度学习表征多元医学信号是目前健康信息学领域中的一个研究热点。为了解决现有模型没有充分结合医学信号多元时序结构特点的问题,该文提出了一种无监督的多级上下文深度卷积自编码器(mCtx-CAE)。首先改进传统卷积神经网络结构,提出一种多元卷积自编码模块,以提取信号片段内的多元上下文特征;其次,提出采用语义学习技术对信号片段间的时序信息进行自编码,进一步提取时序上下文特征;最后通过共享特征表示设计目标函数,训练端到端的多级上下文自编码器。实验结果表明,该文所提模型在两种应用于不同医疗场景下的多模态和多通道数据集(UCD和CHB-MIT)上表现均优于其它无监督特征学习方法,能有效提高多元医学信号的融合特征表达能力,对提高临床时序数据的分析效率有着重要意义。

  相似文献   

8.
当采用高分辨雷达对空间微动目标进行观测时,往往能同时获得其窄带、宽带回波。为充分利用其中蕴含的丰富电磁散射、形状、结构及运动信息,该文提出基于稀疏自编码器(SAE)的空间微动目标特征级融合识别方法。在训练阶段,首先采用卷积神经网络(CNN)分别提取训练集中微动目标回波的1维高分辨距离像(HRRP)、时频图(JTF)及距离-瞬时多普勒像(RID)层级特征。随后,将提取的3个深层特征进行1维拼接形成联合特征向量,并采用SAE自动学习联合特征向量的隐层特征。进而剔除SAE解码部分并在编码器后接入Softmax分类器构成识别网络。最后,利用SAE网络参数对识别网络进行初始化,并利用上述联合特征向量对其进行微调得到训练好的识别网络。在测试阶段,将CNN所提测试集的联合特征向量直接输入训练好的识别网络以得到融合识别结果。不同条件下的电磁仿真数据识别结果证明了所提方法的有效性及稳健性。  相似文献   

9.
张秀  周巍  段哲民  魏恒璐 《红外与激光工程》2019,48(1):126005-0126005(7)
针对卷积稀疏编码算法中特征映射的准确性的问题,为了进一步提高图像超分辨率重建的的质量,文中提出一种基于卷积稀疏自编码的图像超分辨率重建算法。该算法首先在预训练阶段利用稀疏自编码器对输入高低分辨率图像分别进行训练,得到对应的图像稀疏特征表示;然后再由卷积神经网络根据得到的稀疏系数共同训练相应的滤波器及特征映射函数并更新到最优解;最后由高分辨率滤波器和对应的稀疏表示系数卷积求和,得到高分辨率重建图像估计。实验结果显示,改进算法的峰值信噪比(PSNR)结果较卷积稀疏编码算法提高了近0.1 dB,有效提高了重建图像的质量。  相似文献   

10.
自动调制分类在无线频谱异常检测和无线电环境感知中将发挥重要作用.随着深度学习算法的突破,调制分类任务可利用神经网络达到前所未有的高分类精确度.文中提出了一种新颖的神经网络,称为长短期卷积深度神经网络(LCDNN).该网络创造性地结合了长短期记忆网络(LSTM)、卷积神经网络(CNN)和深度网络体系结构的优点.该模型无需...  相似文献   

11.
针对目前大多数人脸识别算法参数多、计算量大,难以部署到移动端和嵌入式设备中的问题,提出了一种基于改进MobileFaceNet的人脸识别方法。通过对MobileFaceNet模型结构的调整,将bottleneck模块优化为sandglass模块,改良深度卷积和逐点卷积的相对位置,适当增大sandglass模块的输出通道数,从而减少特征压缩时的信息丢失,增强人脸空间特征的提取。实验结果表明:改进后的方法在LFW测试数据集上准确率达99.15%,模型大小和计算量分别仅为原算法的61%和45%,验证了所提方法的有效性。  相似文献   

12.
针对智能交通系统中小尺度交通标志识别率低的问题,文中提出一种改进卷积神经网络的交通标志识别方法。该方法通过在Faster R-CNN算法的低层特征图上增加优化的RPN网络,提升了小尺度交通标志的检测率。该方法还利用Max Pooling方法实了现图像的局部细节特征与全局语义特征充分融合。在TT-100K数据集上稍微实验结果表明新方法可以明显提高小尺度交通标志的识别率。  相似文献   

13.
以安检X光图像管制刀具自动检测识别系统为研究对象,针对原始SSD(Single Shot MultiBox Detector)算法对浅层特征图表征能力不强,在训练阶段小目标特征逐渐消失,检测精度与实时性不佳,存在对安检危险品中管制刀具等小目标漏检误检等问题,从两个方面对原始SSD进行改进:一方面,用抗退化性能更强的ResNet34网络替换SSD中的基础网络VGG16,构建SSD-ResNet34网络模型,对基础网络后三层作卷积并进行轻量级网络融合,形成新的低层特征图;将网络部分扩展层作反卷积,形成新的高层特征图。另一方面,采用跳跃连接的方式将高层特征图和低层特征图进行多尺度特征融合。经实验分析,改进后的算法对X光图像管制刀具等小目标的检测精度和速度均有明显提升,且算法鲁棒性好,实时性良好。在VOC2007+2012通用数据集上,改进SSD算法的检测精度比SSD算法高1.7%,达到了80.5%。  相似文献   

14.
在深度学习技术的发展驱动下,智慧应用场景对文本识别任务提出了更高的要求。现有方法更加侧重构建强大的视觉特征提取网络,忽略了文本序列特征的提取能力。针对该问题,提出了一种基于层次自注意力的场景文本识别网络。通过融合卷积和自注意力可以建立并增强文本序列信息与视觉感知信息间的联系。由于视觉特征和序列特征在全局空间中的充分交互,有效地减小了复杂背景噪声对识别精度的影响,实现了对规则和不规则场景文本的鲁棒性预测。实验结果表明,所提方法在各数据集上均表现出竞争力。尤其是在CUTE数据集上可以实现81.4%,6.24 ms的最佳精度和速度,具备一定的应用潜力。  相似文献   

15.
传统的浅层学习神经网络虽然结构简单,算法速度快,但错误率较高,且容易陷入局部最小。文中采用深度结构的深度置信网,优化基于传统BP神经网的初始值,以获得较好的检测结果,并利用Dropout技术改进BP网络隐层单元,获得较快的运算速度。实验证明,经过DBN和Dropout改善后的网络错误率有明显降低,并且算法实时性得到了一定改善。  相似文献   

16.
付晓  沈远彤  付丽华  杨迪威 《电子学报》2018,46(5):1041-1046
稀疏自编码网络在自然语言、图像处理等领域都取得了显著效果.已有的研究表明增加网络提取的特征个数可以优化稀疏自编码网络的处理效果,同时该操作将导致网络训练耗时过长.为尽可能减少网络的训练时间,本文提出了一种基于特征聚类的稀疏自编码快速算法.本算法首先根据K均值聚类最优数确定本质特征的个数,再由网络训练得到本质特征,并通过旋转扭曲增加特征的多样性,使网络处理效果得到提升的同时,减少网络训练耗间.实验在标准的手写体识别数据库MNIST和人脸数据库CMU-PIE上进行,结果表明本文所提算法能在保证网络正确率有所提升的同时,大幅度缩短网络训练耗时.  相似文献   

17.
周涛  王媛媛  吴翠颖 《电视技术》2016,40(10):118-126
深度学习被引入机器学习领域与大数据的完美结合加快了人工智能实现的涉伐,近年来备受学术界和工业界的广泛关注.从深度学习的3种经典模型出发,主要做了5方面的工作:第一,针对深度信念网络,从网络结构(隐含层数、RBM结构、DBN级联),学习算法(基本算法、优化算法与其他方法结合),硬件系统(GPU,FPGA)三个方面进行总结;第二,针对卷积神经网络,从网络结构(输入层、隐含层、CNN个数),学习算法,硬件系统三个方面进行归纳;第三,针对堆栈自编码器,以时间为轴对其发展进行梳理,阐述相应自编码器的方法改进;第四,从医学图像分割、医学图像识别和计算机辅助诊断3个方面详细探讨深度学习在医学图像分析领域中的应用;最后从大数据浪潮、模型构建、特征学习、应用拓展4个方面对深度学习的发展进行展望.  相似文献   

18.
With the continuous progress of The Times and the development of technology,the rise of network social media has also brought the“explosive”growth of image data.As one of the main ways of People’s Daily communication,image is widely used as a carrier of communication because of its rich content,intuitive and other advantages.Image recognition based on convolution neural network is the first application in the field of image recognition.A series of algorithm operations such as image eigenvalue extraction,recognition and convolution are used to identify and analyze different images.The rapid development of artificial intelligence makes machine learning more and more important in its research field.Use algorithms to learn each piece of data and predict the outcome.This has become an important key to open the door of artificial intelligence.In machine vision,image recognition is the foundation,but how to associate the low-level information in the image with the high-level image semantics becomes the key problem of image recognition.Predecessors have provided many model algorithms,which have laid a solid foundation for the development of artificial intelligence and image recognition.The multi-level information fusion model based on the VGG16 model is an improvement on the fully connected neural network.Different from full connection network,convolutional neural network does not use full connection method in each layer of neurons of neural network,but USES some nodes for connection.Although this method reduces the computation time,due to the fact that the convolutional neural network model will lose some useful feature information in the process of propagation and calculation,this paper improves the model to be a multi-level information fusion of the convolution calculation method,and further recovers the discarded feature information,so as to improve the recognition rate of the image.VGG divides the network into five groups(mimicking the five layers of AlexNet),yet it USES 3*3 filters and combines them as a convolution sequence.Network deeper DCNN,channel number is bigger.The recognition rate of the model was verified by 0RL Face Database,BioID Face Database and CASIA Face Image Database.  相似文献   

19.
胡少聪 《电子科技》2019,32(6):82-86
作为非接触式生物识别方法之一,人脸识别在诸多情况下被广泛使用。然而,传统的人脸识别方法由于识别准确度低以及在多个场合的应用受到限制,已不能满足目前的需求。文中提出了采用深度学习的方法来实现脸部标志检测和无限制人脸识别。为解决人脸标志检测问题,使用一种深层卷积神经网络的逐层训练方法,以帮助卷积神经网络进行收敛,并提出了一种避免过拟合的样本变换方法;为了解决人脸识别问题,文中提出了一种SIAMESE卷积神经网络,其在不同部位和尺度上进行训练。实验测试显示,ORL和人脸识别算法的精度分别达到了91%和81%。  相似文献   

20.
基于深度学习的视频中人体动作识别进展综述   总被引:4,自引:0,他引:4       下载免费PDF全文
罗会兰  童康  孔繁胜 《电子学报》2019,47(5):1162-1173
视频中的人体动作识别是计算机视觉领域内一个充满挑战的课题.不论是在视频信息检索、日常生活安全、公共视频监控,还是人机交互、科学认知等领域都有广泛的应用.本文首先简单介绍了动作识别的研究背景、意义及其难点,接着从模型输入信号的类型和数量、是否结合了传统特征提取方法、模型预训练三个维度详细综述了基于深度学习的动作识别方法,及比较分析了它们在UCF101和HMDB51这两个数据集上的识别效果.最后分别从视频预处理、视频中人体运动信息表征、模型学习训练这三个角度对未来动作识别可能的发展方向进行了论述.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号