首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
作为人类精神活动产物的艺术图像,其本身蕴含着丰富的情感语义信息,研究艺术图像的情感分类有助于艺术图像的鉴赏与保护,以图像为对象的情感分类研究已成为情感计算的研究热点,但该分类主要依赖于图像低层特征的抽取,从而导致图像情感分类结果不高.本文提出了一种基于底层特征和注意力机制的艺术图像情感分类模型,即提取艺术图像的CLAH...  相似文献   

2.
苏赋  吕沁  罗仁泽 《电信科学》2019,35(11):58-74
近年来,深度学习在计算机视觉领域中的表现优于传统的机器学习技术,而图像分类问题是其中最突出的研究课题之一。传统的图像分类方法难以处理庞大的图像数据,且无法满足人们对图像分类精度和速度的要求,而基于深度学习的图像分类方法突破了此瓶颈,成为目前图像分类的主流方法。从图像分类的研究意义出发,介绍了其发展现状。其次,具体分析了图像分类中最重要的深度学习方法(即自动编码器、深度信念网络与深度玻尔兹曼机)以及卷积神经网络的结构、优点和局限性。再次,对比分析了方法之间的差异及其在常用数据集上的性能表现。最后,探讨了深度学习方法在图像分类领域的不足及未来可能的研究方向。  相似文献   

3.
作为机器学习的分支,深度学习克服了机器学习在提取特征上的弱点,能从海量数据中提取抽象特征.其特征表达能力和泛化能力高,面对海量遥感影像数据也能高效准确的提取特征.遥感影像分类是从提取影像中各类地物特征并归类处理,是遥感影像处理中的关键技术.基于深度学习的遥感图像分类可以弥补传统机器学习分类精度不高、效率低和泛化能力不足...  相似文献   

4.

为解决传统遥感图像分类方法特征提取过程复杂、特征表现力不强等问题,该文提出一种基于深度卷积神经网络和多核学习的高分辨率遥感图像分类方法。首先基于深度卷积神经网络对遥感图像数据集进行训练,学习得到两个全连接层的输出将作为遥感图像的两种高层特征;然后采用多核学习理论训练适合这两种高层特征的核函数,并将它们映射到高维空间,实现两种高层特征在高维空间的自适应融合;最后在多核融合特征的基础上,设计一种基于多核学习-支持向量机的遥感图像分类器,对遥感图像进行精确分类。实验结果表明,与目前已有的基于深度学习的遥感图像分类方法相比,该算法在分类准确率、误分类率和Kappa系数等性能指标上均有所提升,在实验测试集上3个指标分别达到了96.43%, 3.57%和96.25%,取得了令人满意的结果。

  相似文献   

5.
图像分类是通过图片所给的特征信息将不同的事物进行识别的一种图像处理技术。随着科学技术的快速发展以及人们对生活质量越来越高的需求,图像的自动分类技术已经运用到各个发展领域当中。当我们在图像上进行分类操作时,传统的图像分类方法由于不能准确掌握识别对象之间的内在联系,同时传统方法也因数据的特征性维度太高而导致识别对象的特征表达受到限制,所以取得的实验结果并不理想。针对以上内容文章提出了一种基于卷积神经网络的图像检测方法,该实验的算法主要借鉴了深度学习及卷积神经网络。与以往的传统图像分类方法不同,深度卷积神经网络模型可以同时进行特征学习和图像分类。通过对实验的各个部分结构进行改进和对卷积神经网络模型进行优化,从而防止过拟合现象,继而提高图像检测的准确度,在CIFAR-10数据库上进行的实验表明,该方法改进后的深度学习模型在图像检测方面取得了有效的结果。  相似文献   

6.
针对遥感影像场景分类提出一种改进的中心聚类的深度学习模型,该模型通过改进不同类型特征的距离间隔,提高遥感图像场景分类的性能.与现有其他深度学习模型相比,该模型通过添加聚类中心以及特征与聚类中心的距离间隔约束,设计新的目标函数.新目标函数由交叉熵损失和中心聚类间隔损失构成.通过在两个公共基准数据集上评估所提出的目标函数,...  相似文献   

7.
为实现在只有少量标记数据情况下的高质量的图像分类,本文提出了一种基于深度卷积神经网络的图上半监督极化SAR图像分类算法.该算法将极化SAR图像建模为无向图,并基于该无向图,定义了包含半监督项,卷积神经网络项和类标光滑项的能量函数.算法所采用的卷积神经网络提取抽象的数据驱动的极化特征.半监督项约束了有标记像素的类标在分类过程中保持不变.类标光滑项约束了像素间类标的光滑性.基于对PauliRGB图像进行超像素分割而产生的初始化类标图,交替迭代优化所定义的能量函数直至其收敛.在两幅真实极化SAR图像上的实验结果表明,该算法达到了优异的分类效果,其性能优于当前已有算法.  相似文献   

8.
卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在SAR图像数据集上的应用仍处于起步阶段。基于此,该文从神经元特征提取能力和网络决策依据两个层面出发,提出了一种面向SAR图像的CNN模型可视化方法。首先,基于神经元的激活值,对神经元在其感受野范围内的目标结构学习能力进行可视化,然后提出一种通道-空间混合的类激活映射方法,通过对SAR图像中的重要区域进行定位,为模型的决策过程提供依据。实验结果表明,该方法给出了模型在不同设置下的可解释性分析,有效拓展了卷积神经网络在SAR图像上的可视化应用。  相似文献   

9.
本文针对环境监控视频图像分类,文章从集成卷积神经网络的角度,探析了其在图像分类中的有效应用,以卷积神经网络实现图像处理,建立不同计算神经节点,评估图像并进行分类。实验结果表明,深度神经网络拥有最大间隔和最小分类误差,是对交叉熵准则的有效补充,对图像的分类处理结果良好,值得进一步的研究和推广。  相似文献   

10.
现阶段在开展目标检测工作时,当需要更换检测目标时就需要完成卷积神经网络的重新训练,导致在更换检测目标时投入更多的训练成本,花费更多的时间,降低了目标检测的准确率和效率。针对这种问题,提出了准确划分检测目标各个检测状态的种类,对输入的图像实时使用卷积神经网络图像分类模型完成图像分类,借助图像分类类别来完成检测目标状态判定。测试表明,这种方法能够满足检测目标快速更换的要求,能够极大提高检测目标的准确性,同时也在很大程度上降低了训练成本。  相似文献   

11.
本文提出了一种基于判别子字典学习算法的图像分类优化方法.在判别字典学习算法的基础上,引入字典矩阵的正则化约束项,针对每一类图像学习其对应的特定字典,使字典中包含该类别的特定原子,规避不同子字典之间原子的相关性.同时,引入标签信息矩阵和拉普拉斯正则化矩阵,使大系数集中在某一类别的特定原子上,属于同一类别的样本彼此靠近,从而提高字典的判别能力.将该算法应用在3种不同的数据集上,实验结果证明了所提方法的有效性.  相似文献   

12.
The task of multimodal sentiment classification aims to associate multimodal information, such as images and texts with appropriate sentiment polarities. There are various levels that can affect human sentiment in visual and textual modalities. However, most existing methods treat various levels of features independently without having effective method for feature fusion. In this paper, we propose a multi-level fusion classification (MFC) model to predict the sentiment polarity based on the fusing features from different levels by exploiting the dependency among them. The proposed architecture leverages convolutional neural networks ( CNNs) with multiple layers to extract levels of features in image and text modalities. Considering the dependencies within the low-level and high-level features, a bi-directional (Bi) recurrent neural network (RNN) is adopted to integrate the learned features from different layers in CNNs. In addition, a conflict detection module is incorporated to address the conflict between modalities. Experiments on the Flickr dataset demonstrate that the MFC method achieves comparable performance compared with strong baseline methods.  相似文献   

13.
Image downscaling is one of the widely used operations in image processing and computer graphics. It was recently demonstrated in the literature that kernel-based convolutional filters could be modified to develop efficient image downscaling algorithms. In this work, we present a new downscaling technique which is based on kernel-based image filtering concept. We propose to use pairwise co-occurrence similarity of the pixelpairs as the range kernel similarity in the filtering operation. The co-occurrence of the pixel-pair is learned directly from the input image. This co-occurrence learning is performed in a neighborhood based fashion all over the image. The proposed method can preserve the high-frequency structures, which were present in the input image, into the downscaled image. The idea is further extended to the case of fractions factor of downscaling. The resulting images retain visually-important details and do not suffer from edge-blurring artifact. We demonstrate the effectiveness of our proposed approach with extensive experiments on a large number of images downscaled with various downscaling factors.  相似文献   

14.
王俊岭  彭雯  蔡焱 《电视技术》2017,(11):40-45
针对浅层次大规模图像分类的低精度问题,提出深层次特征学习的Adaboost图像分类算法.首先以DBN作为弱分类器对样本图像进行学习,根据每次训练得到的分类错误率以及各样本的分类准确性调整权值;然后在所有弱分类器训练好以后,使用BP算子回溯再次整体调整体样本权值;最后将所有弱分类器集成强分类器,输出最终分类结果.使用MNIST和ETH-80两种数据集进行实验仿真,并将分类结果与其他算法进行比较.结果表明所提算法的分类精度明显高于其他算法,有效实现了高精度的大规模图像分类.  相似文献   

15.
张逸  周莉  陈杰 《电子设计工程》2022,30(7):6-9,14
近些年来因心血管疾病导致的人类死亡人数不断增加,心律失常是心血管疾病发病前的常见症状.为了提高心电图对心律失常分类的效率和准确率,使医生能对心律失常及时地作出诊断和治疗,提出一种基于二维卷积神经网络模型的心律失常分类方法.该方法使用美国麻省理工学院提供的研究心律失常的MIT-BIH数据库来生成实验数据集对网络进行训练和...  相似文献   

16.
17.
顾玥  李丹  高凯辉 《电信科学》2021,37(3):105-113
随着互联网技术的不断发展以及网络规模的不断扩大,应用的类别纷繁复杂,新型应用层出不穷。为了保障用户服务质量(QoS)并确保网络安全,准确快速的流量分类是运营商及网络管理者亟须解决的问题。首先给出网络流量分类的问题定义和性能指标;然后分别介绍基于机器学习和基于深度学习的流量分类方法,分析了这些方法的优缺点,并对现存问题进行阐述;接着围绕流量分类线上部署时会遇到的3个问题:数据集问题、新应用识别问题、部署开销问题对相关工作进行阐述与分析,并进一步探讨目前网络流量分类研究面临的挑战;最后对网络流量分类下一步的研究方向进行展望。  相似文献   

18.
显著区域检测可应用在对象识别、图像分割、视 频/图像压缩中,是计算机视觉领域的重要研究主题。然而,基于不 同视觉显著特征的显著区域检测法常常不能准确地探测出显著对象且计算费时。近来,卷积 神经网络模型在图像分析和处理 领域取得了极大成功。为提高图像显著区域检测性能,本文提出了一种基于监督式生成对抗 网络的图像显著性检测方法。它 利用深度卷积神经网络构建监督式生成对抗网络,经生成器网络与鉴别器网络的不断相互对 抗训练,使卷积网络准确学习到 图像显著区域的特征,进而使生成器输出精确的显著对象分布图。同时,本文将网络自身误 差和生成器输出与真值图间的 L1距离相结合,来定义监督式生成对抗网络的损失函数,提升了显著区域检测精度。在MSRA 10K与ECSSD数据库上的实 验结果表明,本文方法 分别获得了94.19%与96.24%的准确率和93.99%与90.13%的召回率,F -Measure值也高达94.15%与94.76%,优于先 前常用的显著性检测模型。  相似文献   

19.
In this paper, we propose a supervised learning approach based on an Artificial Neural Network (ANN) model for real-time classification of subtasks in a physical human–robot interaction (pHRI) task involving contact with a stiff environment. In this regard, we consider three subtasks for a given pHRI task: Idle, Driving, and Contact. Based on this classification, the parameters of an admittance controller that regulates the interaction between human and robot are adjusted adaptively in real time to make the robot more transparent to the operator (i.e. less resistant) during the Driving phase and more stable during the Contact phase. The Idle phase is primarily used to detect the initiation of task. Experimental results have shown that the ANN model can learn to detect the subtasks under different admittance controller conditions with an accuracy of 98% for 12 participants. Finally, we show that the admittance adaptation based on the proposed subtask classifier leads to 20% lower human effort (i.e. higher transparency) in the Driving phase and 25% lower oscillation amplitude (i.e. higher stability) during drilling in the Contact phase compared to an admittance controller with fixed parameters.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号