首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
声场景分类,就是训练计算机通过声音中所包含的信息将声音正确的划分到其所属的场景中,其在物联网设备、智能助听器、自动驾驶等领域有着广泛的应用。本文根据声学特征谱图的特点和深度学习中的卷积神经网络理论,提出了一种基于卷积神经网络的声场景分类方法。首先提取音频的对数Mel谱图及其一阶二阶差分谱图,并在通道维度上进行拼接,随后利用中值滤波器对融合谱图进行分层,得到两个融合谱图分量。然后搭建了双路径深度卷积神经网络分别对每个谱图分量进行建模,并在系统输出前将两个路径获得的特征图进行融合,最后通过全连接层进行分类。并在TUT数据集上进行实验,分类准确率可达79.2%  相似文献   

3.
针对单一尺度卷积神经网络(CNN)对船舶图像分类的局限性,该文提出一种多尺度CNN自适应熵加权决策融合方法用于船舶图像分类.首先使用多尺度CNN提取不同尺寸的船舶图像的多尺度特征,并训练得到不同子网络的最优模型;接着利用测试集船舶图像在最优模型上测试,得到多尺度CNN的Softmax函数输出的概率值,并计算得到信息熵,...  相似文献   

4.
针对单一尺度卷积神经网络(CNN)对船舶图像分类的局限性,该文提出一种多尺度CNN自适应熵加权决策融合方法用于船舶图像分类.首先使用多尺度CNN提取不同尺寸的船舶图像的多尺度特征,并训练得到不同子网络的最优模型;接着利用测试集船舶图像在最优模型上测试,得到多尺度CNN的Softmax函数输出的概率值,并计算得到信息熵,进而实现对不同输入船舶图像赋予自适应的融合权重;最后对不同子网络的Softmax函数输出概率值进行自适应熵加权决策融合实现船舶图像的最终分类.在VAIS数据集和自建数据集上分别进行了实验,提出的方法的分类准确率分别达到了95.07%和97.50%,实验结果表明,与单一尺度CNN分类方法以及其他较新方法相比,所提方法具有更优的分类性能.  相似文献   

5.
梁雪琦 《电视技术》2016,40(11):7-11
针对大多数场景分类方法只能学习浅层特征,忽略图像之间的相关结构信息,提出一种基于Gist特征与卷积神经网络结合的场景图像分类方法.其中Gist特征用于提取场景图像的全局特征,并将其作为深度学习模型的输入,通过逐层训练卷积神经网络,提取更高层次的特征,并用训练好的卷积神经网络进行分类.实验在O&T室外场景图像数据集和MNIST手写体数据集上考察了batchsize、卷积核对分类结果的影响,并与DBN,NN,SVM和CART作为分类器的分类结果进行比较,充分说明了本文方法的有效性.  相似文献   

6.
7.
现阶段在开展目标检测工作时,当需要更换检测目标时就需要完成卷积神经网络的重新训练,导致在更换检测目标时投入更多的训练成本,花费更多的时间,降低了目标检测的准确率和效率。针对这种问题,提出了准确划分检测目标各个检测状态的种类,对输入的图像实时使用卷积神经网络图像分类模型完成图像分类,借助图像分类类别来完成检测目标状态判定。测试表明,这种方法能够满足检测目标快速更换的要求,能够极大提高检测目标的准确性,同时也在很大程度上降低了训练成本。  相似文献   

8.
提出一种基于卷积神经网络中残差网络的遥感图像场景分类方法.本文方法在原网络模型中嵌入了跳跃连接和协方差池化两个模块,用于连接多分辨率特征映射和融合不同层次的多分辨率特征信息,并在3个公开的经典遥感数据集上进行了实验.结果证明,本文方法不仅可以将残差网络中不同层次的多分辨率特征信息融合在一起,还可以利用高阶信息来实现更具...  相似文献   

9.
10.
王晨  汤心溢  高思莉 《红外技术》2017,39(8):728-733
采用深度学习的方法实现红外图像场景语义理解.首先,建立含有4类别前景目标和1个类别背景的用于语义分割研究的红外图像数据集.其次,以深度卷积神经网络为基础,结合条件随机场后处理优化模型,搭建端到端的红外语义分割算法框架并进行训练.最后,在可见光和红外测试集上对算法框架的输出结果进行评估分析.实验结果表明,采用深度学习的方法对红外图像进行语义分割能实现图像的像素级分类,并获得较高的预测精度.从而可以获得红外图像中景物的形状、种类、位置分布等信息,实现红外场景的语义理解.  相似文献   

11.
场景识别是计算机视觉研究中的一项基本任务.与图像分类不同,场景识别需要综合考虑场景的背景信息、局部场景特征以及物体特征等因素,导致经典卷积神经网络在场景识别上性能欠佳.为解决此问题,文中提出了一种基于深度卷积特征的场景全局与局部表示方法.此方法对场景图片的卷积特征进行变换从而为每张图片生成一个综合的特征表示.使用CAM...  相似文献   

12.
齐永锋  李占华 《红外技术》2020,42(2):190-197
传统的去雾霾方法会导致天空、白云和明亮区域内的颜色失真.为了解决以上问题,提出了一种基于多尺度卷积神经网络和分类统计的去除图像雾霾的方法.首先用多尺度卷积神经网络估计图像的透射率,其次对所估计的透射率进行分类统计以确定在暗通道内天空、白云和明亮区域的像素值,最后通过低通高斯滤波器平滑图像场景的辐射度,得到恢复的无雾霾图像.实验结果表明,采用提出的方法对图像去雾霾后明亮区域内的颜色不会失真,且保留了图像的自然外观,对合成图像和真实图像均有较好的去雾霾效果.  相似文献   

13.
实弹射击是部队的基础军事训练项目。现有报靶系统中基于计算机视觉的弹孔识别定位系统由于具有快速、精确、安全、人员成本低等优点而被广泛应用到该项目中。然而,计算机视觉系统处理的图像通常受镜头加工工艺以及相机轴向与被测对象所在平面不垂直的影响,导致被测对象的图像产生畸变,最终会给弹孔坐标位置的精准定位带来误差。为了提高基于计算机视觉的自动报靶系统的报靶精度,提出一种基于卷积神经网络的畸变校正算法,只需一张胸环靶面的模板图像即可模拟出大量训练数据集。训练完成后,输入一张畸变图片就可以得到该图片的畸变参数,并利用该参数完成对图像的畸变校正。与传统校正算法的对比结果表明,该算法校正效果较好,有利于提升基于计算机视觉的自动报靶系统的报靶精度。  相似文献   

14.
近年来,卷积神经网络(Convolutional Neural Network,CNN)在合成孔径雷达(Synthetic Aperture Radar,SAR)图像目标分类中取得了较好的分类结果。CNN结构中,前面若干层由交替的卷积层、池化层堆叠而成,后面若干层为全连接层。全卷积神经网络(All Convolutional Neural Network, A-CNN)是对CNN结构的一种改进,其中池化层和全连接层都用卷积层代替,该结构已在计算机视觉领域被应用。针对公布的MSTAR数据集,提出了基于A-CNN的SAR图像目标分类方法,并与基于CNN的SAR图像分类方法进行对比。实验结果表明,基于A-CNN的SAR图像目标分类正确率要高于基于CNN的分类正确率。  相似文献   

15.
With the continuous progress of The Times and the development of technology,the rise of network social media has also brought the“explosive”growth of image data.As one of the main ways of People’s Daily communication,image is widely used as a carrier of communication because of its rich content,intuitive and other advantages.Image recognition based on convolution neural network is the first application in the field of image recognition.A series of algorithm operations such as image eigenvalue extraction,recognition and convolution are used to identify and analyze different images.The rapid development of artificial intelligence makes machine learning more and more important in its research field.Use algorithms to learn each piece of data and predict the outcome.This has become an important key to open the door of artificial intelligence.In machine vision,image recognition is the foundation,but how to associate the low-level information in the image with the high-level image semantics becomes the key problem of image recognition.Predecessors have provided many model algorithms,which have laid a solid foundation for the development of artificial intelligence and image recognition.The multi-level information fusion model based on the VGG16 model is an improvement on the fully connected neural network.Different from full connection network,convolutional neural network does not use full connection method in each layer of neurons of neural network,but USES some nodes for connection.Although this method reduces the computation time,due to the fact that the convolutional neural network model will lose some useful feature information in the process of propagation and calculation,this paper improves the model to be a multi-level information fusion of the convolution calculation method,and further recovers the discarded feature information,so as to improve the recognition rate of the image.VGG divides the network into five groups(mimicking the five layers of AlexNet),yet it USES 3*3 filters and combines them as a convolution sequence.Network deeper DCNN,channel number is bigger.The recognition rate of the model was verified by 0RL Face Database,BioID Face Database and CASIA Face Image Database.  相似文献   

16.
非下采样剪切波变换(NSST)域中低频子带的融合需要人工给定融合模式,因此未能充分捕获源图像的空间连续性和轮廓细节信息.针对上述问题,提出了基于深度卷积神经网络的红外与可见光图像融合算法.首先,使用孪生双通道卷积神经网络学习NSST域低频子带的特征来输出衡量子带空间细节信息的特征图.然后,根据高斯滤波处理的特征图设计了基于局部相似性的测量函数来自适应地调整NSST域低频子带的融合模式.最后,根据NSST域高频子带的方差、局部区域能量以及可见度特征来自适应地设置脉冲耦合神经网络参数完成NSST域高频子带的融合.实验结果表明:该算法QAB/F指标略弱于对比算法,但SF、SP、SSIM以及VIFF指标分别提高了约50.42%、14.25%、7.91%以及61.67%,有效地解决了低频子带融合模式给定的问题,同时又克服了手动设置PCNN参数的缺陷.  相似文献   

17.
缪冉  李菲菲  陈虬 《电子科技》2009,33(12):54-58
场景图像往往是由一些前景物体与背景环境以一定的空间布局组成。同类场景图片由于采样时的尺度、视角以及背景的不同而具有严重的类内差异性;存在于异类场景间的共有物体也导致异类场景图像间具有一定的相似性。据此,文中提出了基于CNN与多尺度空间编码的场景描述及识别方法。该方法结合了多尺度密集采样方法、卷积网络算法与多尺度空间编码方法。多尺度空间的编码方法是将采样网络进行多次空间划分,且对不同子区域中的CNN特征进行聚合,生成多尺度空间VLAD。文中在Scene15场景数据集上进行了实验,结果显示测试精度达到了94.67%。  相似文献   

18.
计算机自动分类心电信号能够减轻医生工作压力并大幅提高诊断速度和准确率。文中针对传统算法中特征提取过程复杂及抗干扰能力弱的问题,提出了一种结合滤波重构和卷积神经网络的心电信号分类算法。该算法首先通过传统信号滤波和心拍序列重构去除原始心电信号中的噪声干扰,然后构建卷积神经网络来自动学习心电信号特征并完成分类。在PhysioNet/CinC Challenge 2017数据集上的分类实验结果表明,该方法的平均F1(查准率、召回率的调和平均)达到了0.8471,优于人工特征提取和常规卷积网络方法,且具有很强的抗干扰能力。  相似文献   

19.
汤磊  丁博  何勇军 《电子学报》2021,49(1):64-71
目前基于视图的三维模型检索已经成为一个研究热点.该方法首先将三维模型表示为二维视图的集合,然后采用深度学习技术进行分类和检索.但是现有的方法在精度和效率方面都有待提升.本文提出了一种新的三维模型检索方法,该方法包括索引建立和模型检索.在索引建立阶段,选择代表性视图输入到训练好的卷积神经网络(Convolutional ...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号