首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
将深度学习引入机器学习使人工智能的研究上了一个新的台阶,深度学习的建模与表征能力强大,在图像处理领域有着非常重要的作用,这为服装风格分类提供了发展机会.为了进一步得到服装图片的风格信息,对原始训练集进行图片增广,扩增数据集,同时通过训练AlexNet卷积神经网络模型,对扩充数据集进行服装风格分类,从而提高服装风格识别精...  相似文献   

2.
在音乐流派分类过程中,音乐流派局部特征与整体特征不一致时,通常采用的局部特征投票取最大的方法(MaxVote)在音频片段流派分类精度不高,而流派特征分布比较均衡时分类结果不合理。针对以上问题,该文提出基于音乐片段流派分布特征的神经网络投票机制(NNVote)和结合高层音乐节奏特征的RhythmNNVote投票方法。实验结果表明,NNVote方法在7个流派上的分类总精度达到68.9%,较MaxVote提高将近10%。  相似文献   

3.
高效精准的乐器识别技术可以有效地推动声源分离、音乐识谱、音乐流派分类等研究的深入发展,可广泛应用于播放列表生成、声学环境分类、乐器智能教学和交互式多媒体等众多领域。近年来,随着乐器识别研究的不断推进,乐器识别系统在性能上有了大幅提高,但依旧存在着部分乐器难以识别、乐器音频特征提取较为困难、复音乐器识别精准度较低等诸多问题,如何借助人工智能技术对乐器进行高效精准的识别成为当前研究的热点和难点。针对当前研究现状,从乐器识别常用音频特征、乐器识别模型及方法和常用数据集三个方面进行综述,并对当前研究中存在的局限性和未来发展趋势进行总结,为乐器识别研究提供一定的借鉴参考。  相似文献   

4.
刘彪    黄蓉蓉  林和  苏伟 《智能系统学报》2019,14(1):186-193
盲人音乐家在交流创作的音乐作品时面临着人工转换和效率较低的问题,信息科学与技术的迅速发展为解决此类问题提供了许多解决方案。虽然目前有许多盲文音乐作品的识别方案,但其存在识别效率低和兼容能力不足等缺点。为了避免传统方案在盲文音乐图片特征提取时过多依赖人工经验,通过研究提出并设计了基于卷积神经网络的识别模型。在对盲文音乐图片的样例数据进行预处理之后,通过多次反复迭代训练,模型就可学习到盲文音乐图片中音乐符号的特征。实验结果表明,该模型的识别有效性和较强的泛化能力为盲文音乐作品的识别提供了一种新的解决方案。  相似文献   

5.
为提高钢琴音频信号的识别准确率,在传统音符特征提取的基础上,再将音符特征叠加到频谱样本中得到音符频谱.然后提出基于卷积神经网络的钢琴音乐分类方法,将各个分类的钢琴音乐的频谱作为卷积神经网络的输入图像进行训练,通过图像识别来间接实现对钢琴音乐的分类.结果表明,改进后的自相关法的识别方法识别准确率更高,且将音符频谱作为训练...  相似文献   

6.
为了提升深度卷积神经网络对音乐频谱流派特征的提取效果,提出一种基于频谱空间域特征注意的音乐流派分类算法模型DCNN-SSA。DCNN-SSA模型通过对不同音乐梅尔谱图的流派特征在空间域上进行有效标注,并且改变网络结构,从而在提升特征提取效果的同时确保模型的有效性,进而提升音乐流派分类的准确率。首先,将原始音频信号进行梅尔滤波,以模拟人耳的滤波操作对音乐的音强及节奏变化进行有效过滤,所生成的梅尔谱图进行切割后输入网络;然后,通过深化网络层数、改变卷积结构及增加空间注意力机制对模型在流派特征提取上进行增强;最后,通过在数据集上进行多批次的训练与验证来有效提取并学习音乐流派特征,从而得到可以对音乐流派进行有效分类的模型。在GTZAN数据集上的实验结果表明,基于空间注意的音乐流派分类算法与其他深度学习模型相比,在音乐流派分类准确率和模型收敛效果上有所提高,准确率提升了5.36个百分点~10.44个百分点。  相似文献   

7.
8.
为了提高卷积神经网络对非线性特征以及复杂图像隐含的抽象特征提取能力,提出优化卷积神经网络结构的人体行为识别方法.通过优化卷积神经网络模型,构建嵌套Maxout多层感知器层的网络结构,增强卷积神经网络的卷积层对前景目标特征提取能力.通过嵌套Maxout多层感知器层网络结构可以线性地组合特征图并选择最有效特征信息,获取的特...  相似文献   

9.
近年来机器学习和深度学习在机器视觉方面已取得了很大进展,表情识别已然成为其中的热门领域.表情识别的应用使得计算机可以更好的理解人类情绪,具有较高的研究价值和应用前景.本文归纳了表情识别领域常用公开数据集;介绍了表情识别的基本流程与常见方法,以及不同卷积神经网络在表情识别方面的方法研究与分析;针对表情识别领域现存问题和未...  相似文献   

10.
目标识别一直是人工智能领域的热点问题. 为了提高目标识别的效率,提出了基于卷积神经网络多层特征提取的目标识别方法. 该方法将图像输入卷积神经网络进行训练,在网络的每个全连接层分别进行特征提取,将得到的特征依次输入到分类器,对输出结果进行比较. 选取经过修正线性单元relu函数激活的低层全连接层作为特征提取层,比选取高层全连接层特征提取的识别率高. 本文构建了办公用品数据集,实现了基于卷积神经网络多层特征提取的办公用品识别系统. 选择AlexNet卷积神经网络模型的relu6层作为特征选取层,选择最优训练图像数量和最优分类器构建系统,从而证明了该方法的可行性.  相似文献   

11.
自适应增强卷积神经网络图像识别   总被引:2,自引:0,他引:2       下载免费PDF全文
目的 为了进一步提高卷积神经网络的收敛性能和识别精度,增强泛化能力,提出一种自适应增强卷积神经网络图像识别算法。方法 构建自适应增强模型,分析卷积神经网络分类识别过程中误差产生的原因和误差反馈模式,针对分类误差进行有目的地训练,实现分类特征基于迭代次数和识别结果的自适应增强以及卷积神经网络权值的优化调整。自适应增强卷积神经网络与多种算法在收敛速度和识别精度等性能上进行对比,并在多种数据集上检测自适应卷积神经网络的泛化能力。结果 通过对比实验可知,自适应增强卷积神经网络算法可以在很大程度上优化收敛效果,提高收敛速度和识别精度,收敛时在手写数字数据集上的误识率可降低20.93%,在手写字母和高光谱图像数据集上的误识率可降低11.82%和15.12%;与不同卷积神经网络优化算法对比,误识率比动态自适应池化算法和双重优化算法最多可降低58.29%和43.50%;基于不同梯度算法的优化,误识率最多可降低33.11%;与不同的图像识别算法对比,识别率也有较大程度提高。结论 实验结果表明,自适应增强卷积神经网络算法可以实现分类特征的自适应增强,对收敛性能和识别精度有较大的提高,对多种数据集有较强的泛化能力。这种自适应增强模型可以进一步推广到其他与卷积神经网络相关的深度学习算法中。  相似文献   

12.
The genre is an abstract feature, but still, it is considered to be one of the important characteristics of music. Genre recognition forms an essential component for a large number of commercial music applications. Most of the existing music genre recognition algorithms are based on manual feature extraction techniques. These extracted features are used to develop a classifier model to identify the genre. However, in many cases, it has been observed that a set of features giving excellent accuracy fails to explain the underlying typical characteristics of music genres. It has also been observed that some of the features provide a satisfactory level of performance on a particular dataset but fail to provide similar performance on other datasets. Hence, each dataset mostly requires manual selection of appropriate acoustic features to achieve an adequate level of performance on it. In this paper, we propose a genre recognition algorithm that uses almost no handcrafted features. The convolutional recurrent neural network‐based model proposed in this study is trained on melspectrogram extracted from 3‐s duration audio clips taken from GTZAN dataset. The proposed model provides an accuracy of 85.36% on 10‐class genre classification. The same model has been trained and tested on 10 genres of MagnaTagATune dataset having 18,476 clips of 29‐s duration. The model has yielded an accuracy of 86.06%. The experimental results suggest that the proposed architecture with melspectrogram as input feature is capable of providing consistent performances across the different datasets  相似文献   

13.
深度卷积神经网络的汽车车型识别方法   总被引:1,自引:0,他引:1  
针对现有汽车车型识别方法计算量大、提取特征复杂等问题,提出一种基于深度卷积神经网络的汽车车型识别方法。该方法借助于深度学习,对经典的卷积神经网络做出改进并得到由多个卷积层和次抽样层构成的深度卷积神经网络。根据五种车型的分类结果,表明该方法在识别率方面较传统方法有明显的提高。实验还研究了网络层数、卷积核大小、特征维数对深度卷积神经网络的性能和识别率的影响。  相似文献   

14.
为解决传统人脸识别算法特征提取困难的问题,提出了基于卷积特征和贝叶斯分类器的人脸识别方法,利用卷积神经网络提取人脸特征,通过主成分分析法对特征降维,最后利用贝叶斯分类器进行判别分类,在ORL(olivetti research laboratory)人脸库上进行实验,获得了99.00%的识别准确率。实验结果表明,卷积神经网络提取的人脸图像特征具有很强的辨识度,与PCA(principal component analysis)和贝叶斯分类器结合之后可有效提高人脸识别的准确率。  相似文献   

15.
随着多旋翼无人机引入输电线路巡检作业后,对巡线人员通过图像判断线路上设备是否有缺陷提出了新的挑战。为了帮助巡线人员做出准确决策,提高发现缺陷的能力,基于深度卷积神经网络,搭建了适用于无人机图像识别的输电线路缺陷识别网络模型。首先详细描述了输电线路缺陷识别图像数据库的建立过程,然后通过分析对比三个预训练前端网络的性能及多个参数对网络模型识别准确率的影响,得到基于Faster R-CNN的输电线路缺陷最优识别网络模型。经过测试集验证,提出的缺陷识别网络模型的识别准确率达到了90%以上,单张图片耗时达到了毫秒级,在识别准确率和耗时上均明显优于其他识别网络模型,为实际巡线工作中的输电线路缺陷判别提供智能有效的决策依据,是机器学习在智能电网中应用的有益探索。  相似文献   

16.
针对现有基于深度学习的人体动作识别模型参数量大、网络过深过重等问题,提出了一种轻量型的双流融合深度神经网络模型并将该模型应用于人体动作识别。该模型将浅层多尺度网络和深度网络相结合,实现了模型参数量的大幅减少,避免了网络过深的问题。在数据集UCF101和HMDB51上进行实验,该模型在ImageNet预训练模式下分别取得了94.0%和69.4%的识别准确率。实验表明,相较于现有大多基于深度学习的人体动作识别模型,该模型大幅减少了参数量,并且仍具有较高的动作识别准确率。  相似文献   

17.
传统的冯诺依曼架构在处理语音等复杂信息时能效较低,神经形态电路更适合于语音等复杂信息的智能处理。常用的音频场景识别方式中的长时特征和短时特征都有其不足之处,卷积神经网络可通过训练提取适合后续分类任务的特征,在特征提取方面有更大的优势。针对四层的卷积神经网络的特征提取及分析方法在语谱图上进行了音频场景识别的研究,并验证了音频场景识别在神经形态电路-类脑计算芯片上的可实现性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号