首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
人工智能与语音识别技术   总被引:1,自引:0,他引:1  
随着深度神经网络在大规模语音识别任务上获得显著效果提升,大数据的不断完善和涟漪效应的提出,在近十年,中国的人工智能也得到了快速发展。作为国内智能语音与人工智能产业领导者的科大讯飞率先将递归神经网络和卷积神经网络应用到真实在线系统中,并提出了全新的深度神经网络结构FSMN——讯飞构型。  相似文献   

2.
唐婷  潘新 《光电子.激光》2022,33(5):488-494
随着深度学习的不断发展,基于深度学习的机器 视觉方法被广泛应用,其中,卷积神 经网络(convolutional neural network,CNN)对高光谱图像(hyperspectral imagery,HSI ) 分类有着显著的效果。传统卷积网络中卷积核的采样位置是固定的,不能根据HSI中复杂的 空间结构而改变,忽略了数据在空间分布上的特征,为了提高高光谱图像分类在实际应用中 的性能,本文提出了一种基于可变形卷积的高光谱图像分类方法,考虑到HSI高维度的特性 , 将可变形卷积从2D引伸到3D,从而更好地提取3D空间上的特征。本文结合双分支双注意机制网络(double- branch dual-attention mechanism network,DBDA)的网络结构和3D可变形卷积,在Indi an Pines(IP)和Botswana(BS)2个数据集上进行了实验。实验结果表明,本文的方法在 综合精度(overall accuracy, OA) 、平均精度(average accuracy, AA)、KAPPA评价标准上均获得了更好的分类准确 率,相较于次优算法,OA提高了0.15%—0.23%,AA提高了0.21%, KAPPA提高了0.000—0.001。  相似文献   

3.
自动调制分类在无线频谱异常检测和无线电环境感知中将发挥重要作用.随着深度学习算法的突破,调制分类任务可利用神经网络达到前所未有的高分类精确度.文中提出了一种新颖的神经网络,称为长短期卷积深度神经网络(LCDNN).该网络创造性地结合了长短期记忆网络(LSTM)、卷积神经网络(CNN)和深度网络体系结构的优点.该模型无需...  相似文献   

4.
成像雷达具有全天时、全天候、远距离、高分辨对地观测的能力,使得雷达系统具有对观测区域进行成像和解译的能力。利用先进信号处理技术实现实时高分辨成像以满足图像解译的需求是雷达成像技术研究的重要目的和意义。随着深度学习的迅速兴起,深度学习网络在逆问题求解中得到广泛应用,也为提升成像质量和成像效率提供新的求解思路。本文基于雷达成像数学模型将雷达成像问题建模为成像逆问题,从逆问题求解的角度分析了基于深度学习的雷达成像方法的可行性。并综述了近年来雷达深度学习技术在合成孔径雷达(Synthetic Aperture Radar,SAR)、逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)、SAR运动目标成像等雷达成像领域的研究现状,在此基础上探讨了目前面临的亟待解决的问题,并对未来发展方向进行了展望。  相似文献   

5.
本文基于神经网络算法在人脸识别中的应用进行了研究,结果表明当前神经网络算法人脸识别算法分为:卷积神经网络人脸识别、循环神经网络人脸识别。  相似文献   

6.
杨玉涟  官钰翔  沈毅  陈豪  朱霞 《电子测试》2020,(21):60-61+99
随着科技的发展人脸识别技术得到了巨大的应用,实现人脸识别的方法也越来越多,本文先简单对比了MLP、RNN、CNN这三个神经网络,然后再对CNN的基础结构进行了一个较为详细的介绍,主要通过对LeNet-5卷积神经网络模型结构的分析来了解卷积神经网络,然后设计了一款针对Olivetti Faces人脸数据库的卷积神经网络模型,通过更改卷积层中卷积核个数以及学习速率来进行一系列实验,最终确定在本次实验当中,当学习速率为0.05时,第一层卷积层卷积核数目为20,第二层卷积层数目为40的时候,能够得到一个针对Olivetti Faces人脸数据库有着较高识别率的一个新的卷积神经网络模型。  相似文献   

7.
8.
张举 《移动信息》2023,45(11):132-135
植物表型是植物受自身基因表达、环境等影响后的外在表现,其决定了农作物产量、品质和抗逆性等。大多数植物表型信息可以通过数字图像处理的方法来获取和分析,且随着深度学习在数字图像处理领域的进展,基于深度学习的图像处理在技术表现上远胜于传统方法。深度学习在网络中有更多的隐藏层,具有更大的鉴别能力和预测能力。文中使用深度学习中的卷积神经网络来自动识别数据集中的定量特征,验证了该方法在小麦植物表型识别、分类、特征识别和定位中的高精度应用。  相似文献   

9.
相较于指纹识别、虹膜识别、声纹识别,人脸识别具有自然、便捷、体验友好的特征,成为大多数人认可的生物识别技术。近年来,随着GPU技术的成熟和数据集规模越来越大,让人脸识别技术的关注方向从基于手工特征的传统方法和传统的机器学习技术转移到使用大数据集训练的深度神经网络。现在,基于深度学习的人脸识别技术在人证比对、实名认证、人机交互、考勤、安防、美颜、趣味拍照、直播、微动作识别(疲劳驾驶、课堂听讲、罪犯审判)等领域得到了广泛的关注。文章首先简述人脸识别的发展历程,之后从深度学习方法、人脸数据集、网络结构、损失函数这四个方面,对目前流行的基于深度学习方法的人脸识别技术做一个较为详细的综述。  相似文献   

10.
本文针对传统变化检测卷积神经网络难以兼顾正确判断变化特征和提取与变化标签相切合的影像特征以及仅通过交叉熵损失函数难以获取较高精度的网络预测参数,同时因为变化样本和不变化样本的数量分布差异较大而导致训练时模型漏检严重并且训练收敛过慢的情况,提出了一种基于Siamese卷积神经网络的变化检测技术,结合基于场景分类的变化检测增强技术和变化检测损失函数硬例关注技术,有效的提高了检测准确率。  相似文献   

11.
基于深度学习和智能规划的行为识别   总被引:1,自引:0,他引:1       下载免费PDF全文
现有行为识别方法在未能持续覆盖造成视频监控盲区所引起行为数据缺失的情况,难以有效实施特征分析、行为分类补全,无法准确识别出智能体完整的行为动作序列.为此,本文提出一种基于深度学习和智能规划的行为识别方法.首先,利用深度残差网络对图像进行分类训练,然后使用递归神经网络对图像特征进行提取深度信息以增强分类效果;其次,运用智能规划的STRIPS (Stanford Research Institute Problem Solver)模型,将深度学习提取的图像特征命题信息转化为规划领域的模型描述文档,并使用前向状态空间搜索规划器推导出完整的行为动作序列.在HMDB51等行为识别公共数据集中,本方法与生成式对抗网络、深度卷积逆向图网络、深度信念网络、支持向量机等同类先进方法相比展现出更好的性能.  相似文献   

12.
在深度学习技术的发展驱动下,智慧应用场景对文本识别任务提出了更高的要求。现有方法更加侧重构建强大的视觉特征提取网络,忽略了文本序列特征的提取能力。针对该问题,提出了一种基于层次自注意力的场景文本识别网络。通过融合卷积和自注意力可以建立并增强文本序列信息与视觉感知信息间的联系。由于视觉特征和序列特征在全局空间中的充分交互,有效地减小了复杂背景噪声对识别精度的影响,实现了对规则和不规则场景文本的鲁棒性预测。实验结果表明,所提方法在各数据集上均表现出竞争力。尤其是在CUTE数据集上可以实现81.4%,6.24 ms的最佳精度和速度,具备一定的应用潜力。  相似文献   

13.
提出了利用硅基光电子芯片进行人工神经网络计算处理的方法。硅基光电子芯片凭借光子的独特性质,能够在人工神经网络的计算处理中发挥高带宽、低时延等优势。在处理深度学习中大量的矩阵计算的乘加任务时,硅基光电子芯片拥有更高的处理速度和更低的能耗,从而有利于深度学习中的人工神经网络计算速度和性能的提升。  相似文献   

14.
基于深度学习的视频中人体动作识别进展综述   总被引:4,自引:0,他引:4       下载免费PDF全文
罗会兰  童康  孔繁胜 《电子学报》2019,47(5):1162-1173
视频中的人体动作识别是计算机视觉领域内一个充满挑战的课题.不论是在视频信息检索、日常生活安全、公共视频监控,还是人机交互、科学认知等领域都有广泛的应用.本文首先简单介绍了动作识别的研究背景、意义及其难点,接着从模型输入信号的类型和数量、是否结合了传统特征提取方法、模型预训练三个维度详细综述了基于深度学习的动作识别方法,及比较分析了它们在UCF101和HMDB51这两个数据集上的识别效果.最后分别从视频预处理、视频中人体运动信息表征、模型学习训练这三个角度对未来动作识别可能的发展方向进行了论述.  相似文献   

15.
针对目前大多数人脸识别算法参数多、计算量大,难以部署到移动端和嵌入式设备中的问题,提出了一种基于改进MobileFaceNet的人脸识别方法。通过对MobileFaceNet模型结构的调整,将bottleneck模块优化为sandglass模块,改良深度卷积和逐点卷积的相对位置,适当增大sandglass模块的输出通道数,从而减少特征压缩时的信息丢失,增强人脸空间特征的提取。实验结果表明:改进后的方法在LFW测试数据集上准确率达99.15%,模型大小和计算量分别仅为原算法的61%和45%,验证了所提方法的有效性。  相似文献   

16.
色散介质的经验模型适合描述等离子体、水、生物肌体组织等媒介。为了反演色散媒介的电磁参数,提出一种基于卷积神经网络的色散介质电磁参数反演方法。在电磁参数反演的过程中,利用前向算法获得色散介质的散射电场,反演算法通过卷积神经网络将原逆散射问题转化为一个回归估计问题。提取不同频率TM波照射下色散介质的散射电场值的实部和虚部作为样本信息并作为卷积神经网络的输入,色散介质电磁参数作为输出,经过适当的训练,重构出自由空间中色散介质圆柱体电磁参数。经过与BP神经网络反演结果的比较,验证了该方法的有效性及准确性。  相似文献   

17.
胡少聪 《电子科技》2019,32(6):82-86
作为非接触式生物识别方法之一,人脸识别在诸多情况下被广泛使用。然而,传统的人脸识别方法由于识别准确度低以及在多个场合的应用受到限制,已不能满足目前的需求。文中提出了采用深度学习的方法来实现脸部标志检测和无限制人脸识别。为解决人脸标志检测问题,使用一种深层卷积神经网络的逐层训练方法,以帮助卷积神经网络进行收敛,并提出了一种避免过拟合的样本变换方法;为了解决人脸识别问题,文中提出了一种SIAMESE卷积神经网络,其在不同部位和尺度上进行训练。实验测试显示,ORL和人脸识别算法的精度分别达到了91%和81%。  相似文献   

18.
针对跳频信号分选存在人工提取参数特征具有复杂性的问题,提出了一种基于深度学习的识别方法。首先对跳频信号进行短时傅里叶变换,得到二维的时频矩阵;接着提取信号的轮廓特征,构造三维矩阵作等高线图,并对等高线图进行预处理;最后把预处理后的等高线图输入到卷积神经网络中进行训练、测试,进而实现分类识别。仿真结果表明,在不需要复杂的人工提取参数特征的基础上,在分选率为100〖WT《Times New Roman》〗%〖WTBZ〗时,所提方法经裁剪处理下的信噪比为-15 dB,比支持向量机和传统K-Means聚类算法都低10 dB。实测数据的算法验证表明,所提方法能够将大疆精灵4Pro、hm无人机、司马航模X8HW以及大疆悟2这四类无人机正确分类。  相似文献   

19.
With the continuous progress of The Times and the development of technology,the rise of network social media has also brought the“explosive”growth of image data.As one of the main ways of People’s Daily communication,image is widely used as a carrier of communication because of its rich content,intuitive and other advantages.Image recognition based on convolution neural network is the first application in the field of image recognition.A series of algorithm operations such as image eigenvalue extraction,recognition and convolution are used to identify and analyze different images.The rapid development of artificial intelligence makes machine learning more and more important in its research field.Use algorithms to learn each piece of data and predict the outcome.This has become an important key to open the door of artificial intelligence.In machine vision,image recognition is the foundation,but how to associate the low-level information in the image with the high-level image semantics becomes the key problem of image recognition.Predecessors have provided many model algorithms,which have laid a solid foundation for the development of artificial intelligence and image recognition.The multi-level information fusion model based on the VGG16 model is an improvement on the fully connected neural network.Different from full connection network,convolutional neural network does not use full connection method in each layer of neurons of neural network,but USES some nodes for connection.Although this method reduces the computation time,due to the fact that the convolutional neural network model will lose some useful feature information in the process of propagation and calculation,this paper improves the model to be a multi-level information fusion of the convolution calculation method,and further recovers the discarded feature information,so as to improve the recognition rate of the image.VGG divides the network into five groups(mimicking the five layers of AlexNet),yet it USES 3*3 filters and combines them as a convolution sequence.Network deeper DCNN,channel number is bigger.The recognition rate of the model was verified by 0RL Face Database,BioID Face Database and CASIA Face Image Database.  相似文献   

20.
针对智能交通系统中小尺度交通标志识别率低的问题,文中提出一种改进卷积神经网络的交通标志识别方法。该方法通过在Faster R-CNN算法的低层特征图上增加优化的RPN网络,提升了小尺度交通标志的检测率。该方法还利用Max Pooling方法实了现图像的局部细节特征与全局语义特征充分融合。在TT-100K数据集上稍微实验结果表明新方法可以明显提高小尺度交通标志的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号