首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对卷积神经网络参数数量多并且分类精度不高的问题,提出了基于轻量型的卷积神经网络模型.该模型是把上层输出先通过数量较少的卷积核,再通过并行操作得到与原模型相同维度的输出.并行处理时,通过不同的卷积核大小增加特征的多样性,最后采用级联或融合的方式把并行输出整合在一起.和同规模的模型相比,该模型在减少参数的同时增加了网络的深度.在实验阶段用该网络在caltech256和I01 food数据集上进行测试,实验结果表明该模型性能更优.  相似文献   

2.
3.
4.
陈煜  贺升权  余勤 《电讯技术》2023,63(11):1696-1703
在信号环境日益复杂、信号调制样式种类多变的情况下,采用深度学习方法实现通信信号的调制识别是一种有效手段。针对当前模型存在着超参数量大、部分信号类型(如正交幅度调制信号)识别率低、识别时间过长等问题,提出了一种基于轻量神经网络的无线电自动调制识别算法。首先通过基于深度可分离卷积的基础单元实现特征提取,并引入通道洗牌操作对不同通道的特征进行重新分配,最终使用注意力机制和Smoothing Maximum Unit(SMU)激活函数加强特征挖掘、复用及学习能力。所提模型能够显著增强空间和通道间的信息交流,有效减少模型超参数量和训练耗时,并进一步解决深层网络中的梯度消失问题。实验结果表明,所提模型的平均识别准确率为90.60%,参数量为75 000,训练耗时更短,优于目前流行的调制识别算法,尤其能缓解模型越复杂响应速度越慢的问题,证明了所提模型的有效性及鲁棒性。  相似文献   

5.
针对主流Transformer网络仅对输入像素块做自注意力计算而忽略了不同像素块间的信息交互,以及输入尺度单一导致局部特征细节模糊的问题,本文提出一种基于Transformer并用于处理视觉任务的主干网络ConvFormer. ConvFormer通过所设计的多尺度混洗自注意力模块(Channel-Shuffle and Multi-Scale attention,CSMS)和动态相对位置编码模块(Dynamic Relative Position Coding,DRPC)来聚合多尺度像素块间的语义信息,并在前馈网络中引入深度卷积提高网络的局部建模能力.在公开数据集ImageNet-1K,COCO 2017和ADE20K上分别进行图像分类、目标检测和语义分割实验,ConvFormer-Tiny与不同视觉任务中同量级最优网络RetNetY-4G,Swin-Tiny和ResNet50对比,精度分别提高0.3%,1.4%和0.5%.  相似文献   

6.
7.
8.
近年来,基于骨架的人体动作识别任务因骨架数据的鲁棒性和泛化能力而受到了广泛关注。其中,将人体骨骼建模为时空图的图卷积网络取得了显著的性能。然而图卷积主要通过一系列3D卷积来学习长期交互联系,这种联系偏向于局部并且受到卷积核大小的限制,无法有效地捕获远程依赖关系。该文提出一种协作卷积Transformer网络(Co-ConvT),通过引入Transformer中的自注意力机制建立远程依赖关系,并将其与图卷积神经网络(GCNs)相结合进行动作识别,使模型既能通过图卷积神经网络提取局部信息,也能通过Transformer捕获丰富的远程依赖项。另外,Transformer的自注意力机制在像素级进行计算,因此产生了极大的计算代价,该模型通过将整个网络分为两个阶段,第1阶段使用纯卷积来提取浅层空间特征,第2阶段使用所提出的ConvT块捕获高层语义信息,降低了计算复杂度。此外,原始Transformer中的线性嵌入被替换为卷积嵌入,获得局部空间信息增强,并由此去除了原始模型中的位置编码,使模型更轻量。在两个大规模权威数据集NTU-RGB+D和Kinetics-Skeleton上进行实验验证,该模型分别达到了88.1%和36.6%的Top-1精度。实验结果表明,该模型的性能有了很大的提高。  相似文献   

9.
针对传统管道表面缺陷检测方法存在效率低、准确率不高的问题,提出一种通过机器视觉检测管道表面缺陷的方法,在采集管道表面缺陷的图像信息后通过卷积神经网络的算法分类不同的缺陷。通过加入批量归一化层,改进低层和中层卷积核的构造,优化了GoogleNet的构造,提高了卷积神经网络的泛化性和收敛性。试验结果表明,应用卷积神经网络后对管道表面缺陷的识别率较高,显著提高了管道表面缺陷识别的效率和准确率,具有较好的工程意义。  相似文献   

10.
随着神经网络技术的不断发展,人体姿态识别在现实生活中扮演着越来越重要的角色,广泛应用于视频监控和智能健身等方面。为满足在移动端易集成的需求,提出一种基于Transformer的姿态识别算法。通过MobileNet中的深度可分离卷积提取特征,同时添加残差结构获取低维度信息,和Transformer的编码结构结合实现人体关键点检测。实验结果表明,训练得到的网络模型的准确率与传统的基于深度学习的姿态识别方法准确率相差不超过1%,但模型参数大幅下降,更加轻量化且便于移动端的部署。  相似文献   

11.
张国山  赵阳  马红悦 《光电子.激光》2019,30(12):1317-1322
手势识别是人机交互,智能语义识别和远程人机 交流领域的热门研究课题。目前基于 视觉的手势识别问题仍是研究的难点,在多变背景下的手势姿态识别仍然存在较大问题。近 年来,随着深度神经网络技术的快速发展,利用网络自主学习的方法来提取手势姿态有关特 征得到了广泛关注。由于卷积神经网络具有较强的学习能力和个体特征的表达能力,本文针 对传统手势识别算法精度低,鲁棒性差的问题,提出了基于卷积神经网络的TensorFlow框架 下加入扁平卷积模块的FD-CNN网络手势识别算法。在预处理数据集后,基于FD-CNN网络的 手 势识别方法可以直接将预处理后的图像输入网络进行训练,最终输出测试结果的识别精度为 99.0%。与传统方法和经典卷积神经网络方法相比,本文方法提高了 网 络系统对样本数据的多样性和复杂性的有效识别,具有较高的识别率和较好的鲁棒性效果。  相似文献   

12.
针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transformer网络(CSTN),然后利用时频分析获取雷达信号的时频特征,对图像进行预处理后输入CSTN模型进行训练,由网络的底部到顶部不断提取图像更丰富的语义信息,最后通过Softmax分类器对六类不同调制方式信号进行分类识别。仿真实验表明:在SNR为-18 dB时,该方法对六类典型雷达信号的平均识别率达到了94.26%,证明了所提方法的可行性。  相似文献   

13.
验证码是目前大部分网站用来防止批量注册、刷票等恶意操作的图灵测试手段.为了帮助开发者设计出更缜密的安全策略,将生成的5000张混合英数的不定长验证码作为训练集,基于PyTorch学习框架,使用卷积循环神经网络来训练模型,CTC算法对标签进行对齐,实现对不定长验证码的识别.实验表明,最终该模型对不定长验证码的识别准确率达...  相似文献   

14.
为实现电力设备铭牌中文字信息的自动识别,提升设备管理的效率,提出一种面向场景文字(scene text)的文本内容识别方法。该方法依赖于从卷积特征中训练得到的基于长短时记忆网络(long short-term memory,LSTM)的视觉注意力模型。一组特征向量由与图像不同区域对应的卷积层提取,从而将图像空间信息编码到特征中。通过这一方式,模型可以选择关注图像的不同部分,并结合卷积特征与注意力权重识别文字。进一步地 ,引入语言模型并修改集束搜索(beam search)策略可以显著改善识别效果。在真实数据集上的结果验证了该方法的有效性。  相似文献   

15.
文章研究了具有云台摄像机(PTZ)的无人机视觉跟踪问题,并设计了能够自动初始化的跟踪系统。该系统首先通过PTZ相机系统拍摄的图像背景,计算包含运动目标的边界;其次,通过卷积神经网络算法决定该边界内是否存在无人机;最后,采用视觉伺服方案调整PTZ参数,使被探测无人机的边界尽可能地延伸到摄像机视场范围内。实验结果表明,文章设计的系统对无人机的快速机动具有较强的鲁棒性。  相似文献   

16.
该文从大黄纹理特征入手研究了卷积神经网络技术在药材识别中的应用.首先介绍了卷积神经网络、研究所需材料及实验设备,然后深入解读了本研究方法技术路线,最后采用卷积神经网络VGG-16构建大黄饮片识别模型.实验结果表明,训练的VGG-16对测试图片集的识别及分类具有较好的效果.从客观性和稳定性来看,采用计算机视觉技术可十分便...  相似文献   

17.
针对传统雷达人体动作识别方法中特征提取能力不足和上下文建模困难的问题,提出了一种结合卷积神经网络(Convolutional Neural Network,CNN)和Swin Transformer的网络模型,用于有效识别分布式脉冲超宽带雷达数据中的人体动作。通过多分支的CNN对多个雷达的多个谱图、雷达数据的幅度和相位等特征进行提取和融合,利用Swin Transformer模块的多层自注意力机制对生成的特征映射进行上下文建模,提取具有高级语义信息的特征。采用代尔夫特理工大学(Technische Universiteit Delft)公开的数据集进行5折交叉验证,结果表明所提方法能够有效识别9类连续人体动作,识别准确率达到98.2%。  相似文献   

18.
19.
人类行为识别作为视频分类中的重要问题,成为计算机视觉中的热门话题.由于卷积神经网络(CNN)的几何结构固定统一,这将会使得其几何变形建模受限,使得行为识别网络难以鲁棒性的识别行为类别.本文提出了一种融入可形变卷积的行为识别网络模型.首先,引入可形变卷积,构建了一种可协同学习空间外观和时间运动线索的模块,该模块分别学习视...  相似文献   

20.
为克服人工读数存在的局限性问题,提高数字仪表读数效率,文章利用计算机视觉技术,自行构建样本数据库并训练卷积神经网络模型识别仪表数字。首先,采集仪表图像并对其进行预处理;其次,对预处理后的字符进行定位和切割;最后,引入训练过的网络模型对仪表数字进行分类识别。实验结果表明,该方法稳定性好、鲁棒性高、识别速度快,可以满足各类场景下的数字仪表读数需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号