期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李家成叶哲江杨嘉林张鹏飞《电视技术》2021,45(8):133-139

为了解决皮肤病图像数据集类内差异大、类间差异小、样本数据集小而带来的过拟合问题,提出基于DSception模块和SE模块的轻量型模型.模型选择ResNet50作为基底结构,用DSception模块代替深度残差网络中的卷积池化层,有效地减少模型训练参数,降低时间复杂度,增加了网络的宽度;利用SE模块代替残差网络中的瓶颈结构,减少训练参数的同时,对图像通道维度重标定,强化特征图重要信息,抑制无用信息.实验表明所提模型准确率达到93.3％,对皮肤病的诊断分类有明显的效果. 相似文献

2.

基于U-Net网络改进算法的视网膜血管分割研究北大核心CSCD

金鹭张寿明《光电子．激光》2022,(8):887-896

针对视网膜图像血管细小,细节特征丢失、梯度下降、爆炸而导致分割效果差的问题,本文提出了一种引入残差块、循环卷积模块和空间通道挤压激励模块的U-Net视网膜血管图像分割模型。首先通过使用一系列随机增强来扩展训练集并对数据集进行预处理,然后在U-Net模型中引入残差块,避免随着网络深度增加,分割准确率达到饱和然后迅速退化以及优化计算成本;并将U-Net网络的底部替换为循环卷积模块,提取图像低层次的特征,并不断的进行特征积累,增强上下文之间的语义信息,获得更有效的分割模型;最后在卷积层之间嵌入空间通道挤压激励模块,通过找到特征较好的通道,强调这一通道,压缩不相关的通道使得网络模型能够加强关键语义特征信息的学习,通过训练过程学习到有效的特征信息,同时增强抗干扰能力。通过在DRIVE数据集上的验证结果可得,本文所提模型的准确率为98.42%,灵敏度达到了82.36%,特异值达到了98.86%。通过和其他网络分割方法比较,本文所提分割方法具有更优的分割效果。相似文献

3.

基于残差混合注意力机制的脑部CT图像分类卷积神经网络模型 总被引：2，自引：0，他引：2

乔思波庞善臣王敏翟雪于世行丁桐《电子学报》2021,49(5):984-991

针对阿尔兹海默症、病变(如脑肿瘤)和健康老化的3类脑部CT图像分类问题,本文提出了一种改进的ResNet-10卷积神经网络模型.该模型在网络的残差映射结构中加入残差混合注意力模块,解决了原模型提取的特征分辨性弱的问题,精确捕捉了脑部组织在CT图像中的位置和内容信息;此外,本文设计了全局平均池化层,简化了模型的复杂度,并在其后引入Dropout机制,缓解了过拟合.在训练阶段,该模型建立了标签平滑交叉熵损失函数,使模型在样本数量有限的情况下仍有较强的泛化能力.系列实验证明了改进后的ResNet-10网络模型在分类脑部CT图像时达到97.47％的分类精度. 相似文献

4.

复杂场景下基于OSA改进的多目标跟踪算法研究

刘志强任世恒《信息技术》2022,(4):123-129

为了提升deepsort多目标跟踪算法中的重识别模块性能,增强网络对图像特征的语义表达,优化算法在复杂场景中对目标身份一致性判断能力.提出OSA模块改进宽残差网络,并利用数据集对改进后的模型进行训练,获取相关数据及权重模型;研究改进网络与原网络在同一数据集下的模型训练效果,并与原重识别模块下的YOLOV3-deepso... 相似文献

5.

基于改进ResNet-18的红外图像人体行为识别方法研究

周啸辉余磊何茜陈涵聂宏欧巧凤熊邦书《激光与红外》2021,51(9):1178-1184

人体行为识别在安全监护、安防监控、智能家居等诸多领域具有重要的研究意义和广泛的应用价值。由于红外信息具有受光照影响小、保护隐私等特性,因此基于红外信息的人体行为识别方法备受国内外学者关注。本文对包含7种行为类别的红外信息进行连续帧拼接处理,构建红外图像数据集。传统的ResNet-18网络性能较为优异,在可见光图像识别上一直表现良好,但在红外图像识别中效果欠佳。本文根据红外图像特性,对其进行相应改进:首先,构建多分支同构结构,替换7×7卷积,增强网络的表达能力;其次,结合最大池化与平均池化,避免丢失有用信息;最后,引入非对称卷积块构成多重残差结构,并与改进CBAM模块结合对残差块进行优化,从而增加网络多样性,提升网络的特征提取能力。实验结果表明,改进ResNet 18网络识别率达到9996,不但高于传统的ResNet 18网络,而且明显优于基于红外图像的其他网络。相似文献

6.

基于时序时空双流卷积的异常行为识别

张仁路高丙朋《现代电子技术》2023,(3):81-87

针对地铁站特定场合下,人体异常行为识别无法有效利用帧间运动时间维度信息,导致人体异常行为识别准确率不高的问题,提出一种深层次残差长短期双流网络结构。将RGB帧和连续光流帧作为双流网络的输入,分别利用ResNet34提取低层特征信息,空间流网络提取运动外观特征信息,时间流网络提取光流运动信息,然后将特征信息输入长短期记忆（LSTM）网络,有效学习空间外观和光流运动的帧间关联时间信息,并且通过多种加权融合策略加强模型识别效果。最后在地铁站异常行为数据集上验证提出的网络结构,并与原双流网络进行对比,改进后的网络识别准确率提高了4.7%,融合后的模型准确率提高了12.9%。实验结果表明,所提方法能够充分利用时间维度信息,可有效提高异常行为识别准确率,在昏暗环境下仍有较好的识别效果。相似文献

7.

基于改进YOLOV4的铁轨裂缝目标检测算法

苗新法李晓琴刘宝莲侯越《光电子．激光》2023,34(8):816-822

针对铁轨表面裂缝的小目标特征及传统检测方法精度低,速度慢等问题,提出一种基于改进YOLOV4的目标检测算法。首先,使用改进的RFB(receptive field block)模块替换空间金字塔池化(spatial pyramid pooling, SPP)结构,以获取特征图更大的有效感受野区域,提升算法的检测精度;其次,采用深度可分离卷积结构替代网络模型中的普通卷积结构,使网络轻量化、提升检测速度;同时,利用K-means++算法重新获取锚框,再对得到的锚框进行线性尺度变化,解决原锚框不适合小目标检测的问题。结果表明改进的YOLOV4算法,平均精度均值(mean average precision,mAP)达到84.8%,相对于原YOLOV4算法提高了3.4%;检测速度(frames per second,FPS)为62.39帧/s,提高了4.07帧/s。相似文献

8.

基于ResNet50改进模型的图像分类研究

辜瑞帆李祥任维民《现代电子技术》2023,(4):107-112

针对深度学习中残差网络ResNet50存在的信息丢失、特征提取不充分、网络过拟合和训练困难等问题，文中提出一种基于改进ResNet50的图像分类算法。针对残差网络ResNet50在提取特征时存在丢失输入特征映射情况，造成信息丢失的问题，对主干网络中Stage4的下采样块添加平均池化层，进一步提高网络特征提取能力；针对ResNet50训练过程中存在网络过拟合以及泛化能力差的问题，使用标签平滑方法对交叉熵损失函数进行修改，有效缓解网络损失值震荡幅度；针对ResNet50计算量大、训练困难的问题，使用混合精度和余弦退火衰减方法对模型进行训练，在加快网络收敛速度的同时提高模型的分类精度。实验结果表明，与原ResNet50网络相比，文中算法在ImageNet-1k数据集上Top1和Top5的精度分别提升3.2%和1.6%，能够更好地应用于图像分类任务。相似文献

9.

一种基于ResPNet的光伏组件红外成像故障检测方法

孙明正李浩《激光与光电子学进展》2023,(24):201-209

目前利用无人机获取光伏组件红外影像数据越来越多地应用于光伏组件故障检测中。但光伏组件红外影像数据各类别样本相似度较高，现有深度学习模型的光伏组件红外影像特征提取能力较低，导致光伏组件多故障类型分类精度偏低。针对以上问题，基于ResNet(residual network)模型构建ResPNet(residual photovoltaic network)模型进行光伏组件红外影像故障检测。ResPNet模型在ResNet模型基础上，加入了底层特征信息增强模块、多尺度特征信息增强模块、全局特征信息增强模块，用于提升模型的光伏组件红外影像特征提取能力。在公开的光伏组件红外影像数据集Infrared Solar Modules上进行实验，ResPNet模型的12类光伏组件红外影像分类精度达到84.6%，不但优于ResNet-50模型，而且优于其他的光伏组件红外影像分类模型。通过级联多个ResPNet模型，取得了该数据集目前已知最高的12类光伏组件红外影像分类检测精度（85.9%）。相似文献

10.

基于通道注意力机制的视频人体行为识别

解怀奇乐红兵《电子技术与软件工程》2020,(4):140-142

本文针对人体行为识别模型中鉴别能力有限的问题,同时避免双流中计算光流的较大时间成本,提出基于通道注意力机制和三维卷积时空注意力模型的行为识别方法。首先,该卷积网络模型使用ResNeXt残差模块,利用三维卷积核有效地提取视频帧时空特征。然后,在此基础上给每个残差模块增加通道注意力机制学习不同特征图的权重,进而形成基于通道域的注意力权重,增强网络结构对人体行为的表征能力。最后,在UCF-101和HMDB-51数据集上,通过交叉熵损失函数训练不同网络深度的行为分类模型。实验结果表明,该模型可以有效提取视频中的时空特征,并在人体行为识别任务中有着较高效率和优秀的准确度。相似文献

11.

基于多尺度注意力机制ResNet的雷达工作模式识别

下载免费PDF全文

卓奕弘熊敬伟潘继飞郭林青《雷达科学与技术》2024,22(2):170-179

雷达工作模式识别是解释雷达行为和功能的基本任务。现有方法难以在信号灵活、环境复杂的条件下筛除脉冲序列中不同空间和不同通道中的冗余信息。本文在深度残差网络的基础上,增加了空间自注意力模块和通道自注意力模块以适应上述信号特点。模型引入自注意力机制以实现雷达序列不同空间和通道的自适应权值分配,使网络能更有效地关注更具差异性的信息,实现了极端条件下雷达工作模式的高精度识别。同经典深度学习网络AlexNet、LeNet、VGGNet、ResNet以及常规深度卷积网络相比,该模型在0~50%漏脉冲条件下,平均识别率提升了36%,在独立测试集40%漏脉冲比例下模型仍然具备90%以上的识别率,证明了所提网络的优越性和有效性。相似文献

12.

基于改进YOLOv5的荧光图像细胞智能检测研究

谭鑫平高志辉韩航迪廖广兰刘智勇《半导体光电》2023,44(5):709-716

为解决人工对荧光原位杂交(Fluorescence In Situ Hybridization, FISH)荧光图像进行结果判读存在的效率低、劳动强度大等问题,针对FISH荧光图像细胞智能检测提出一种融合空域图像增强的改进YOLOv5算法。算法在原始YOLOv5神经网络模型基础上,加入了空域图像增强模块,并选择了模块最佳增强系数,扩大了模型对荧光图像的对比度适应范围,提高了模型的特征提取能力和细胞检测准确率。实验结果显示,改进YOLOv5模型的平均精度均值(Mean Average Precision, mAP)为0.983,达到了比原始模型更优的训练效果和收敛速度,并且,改进YOLOv5模型的细胞识别率达到91.65%,比原始YOLOv5模型提升了9.19%。将细胞智能检测算法嵌入自主开发的荧光图像智能检测软件,结合荧光点检测算法,可给出有效判读结果。相似文献

13.

基于DCResNet的SAR图像车辆目标识别

下载免费PDF全文

王强曹磊史润佳杨非蒋忠进《雷达科学与技术》2021,19(4):387-392

合成孔径雷达（SAR）图像自动目标识别中,特征提取和目标分类是两个重要环节。残差网络（ResNet）作为一种较新的卷积神经网络,凭借其对目标特征的自适应学习能力,在SAR图像分类领域表现突出。本文在ResNet基础上,设计出了密集连接型残差网络（DCResNet）,用于SAR图像目标识别。DCResNet在残差模块中增加了跳跃性连接的密度,不仅继承了ResNet的易学习的优点,还加强了特征的传播和利用率。除此之外,DCResNet采用平均池化的方式进行下采样,抑制了SAR图像中噪声对识别精度造成的影响。关于SAR图像目标识别的实验结果证明,本文提出的DCResNet与ResNet、AlexNet相比,不仅具有更快的收敛速度和推理速度,而且目标分类的准确率更高。相似文献

14.

基于改进ResNet的射频指纹识别方法

谢跃雷邓涵方《电讯技术》2022,62(4):416-423

在无线网络安全和可能存在的射频设备管理应用范围内,针对多个发射同种射频信号的高度相似射频设备的分类识别问题,提出了一种信号双谱与改进的残差神经网络(Residual Neural Network,ResNet)的射频指纹识别方法.首先,将采集到的不同设备的信号做双谱变换得到双谱等高图并打上设备标签,再使用搭建好的改进残... 相似文献

15.

基于电话用户交换机的语音识别系统研究 总被引：3，自引：0，他引：3

刘加胡凯军《电子学报》1999,27(1):5-7

本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Ｖｉｔｅｒｂｉ算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下相似文献

16.

基于改进Res-UNet网络的钢铁表面缺陷图像分割研究

李原李燕君刘进超范衠王庆林《电子与信息学报》2022,44(5):1513-1520

为了提高钢铁质量图像检测的效率和精度,提高生产自动化水平,该文提出一种改进的Res-UNet网络分割算法。使用ResNet50代替ResNet18作为编码模块,增强特征提取能力;修改编码模块,使残差块间稠密连接,增强浅层特征的深度延展,充分利用特征;使用加权Dice损失和加权交叉熵损失(BCEloss)结合的新损失函数缓解样本不均衡的情况;数据集增强策略保证网络学习更多的样本特征,增强细节分割精度。相比于经典的UNet算法,组合优化后的Res-UNet网络的Dice系数最多提高了12.64%,达到0.7930,网络训练时间更短,对各类缺陷的分割精准度更优,证明该文算法在钢铁表面缺陷分割领域具有应用价值。相似文献

17.

Framework for COVID-19 Segmentation and Classification Based on Deep Learning of Computed Tomography Lung Images

下载免费PDF全文

Wessam M. Salama Moustafa H. Aly 《电子科技学刊:英文版》2022,20(3):246-256

Corona Virus Disease 2019 (COVID-19) has affected millions of people worldwide and caused more than 6.3 million deaths (World Health Organization, June 2022). Increased attempts have been made to develop deep learning methods to diagnose COVID-19 based on computed tomography (CT) lung images. It is a challenge to reproduce and obtain the CT lung data, because it is not publicly available. This paper introduces a new generalized framework to segment and classify CT images and determine whether a patient is tested positive or negative for COVID-19 based on lung CT images. In this work, many different strategies are explored for the classification task. ResNet50 and VGG16 models are applied to classify CT lung images into COVID-19 positive or negative. Also, VGG16 and ReNet50 combined with U-Net, which is one of the most used architectures in deep learning for image segmentation, are employed to segment CT lung images before the classifying process to increase system performance. Moreover, the image size dependent normalization technique (ISDNT) and Wiener filter are utilized as the preprocessing techniques to enhance images and noise suppression. Additionally, transfer learning and data augmentation techniques are performed to solve the problem of COVID-19 CT lung images deficiency, therefore the over-fitting of deep models can be avoided. The proposed frameworks, which comprised of end-to-end, VGG16, ResNet50, and U-Net with VGG16 or ResNet50, are applied on the dataset that is sourced from COVID-19 lung CT images in Kaggle. The classification results show that using the preprocessed CT lung images as the input for U-Net hybrid with ResNet50 achieves the best performance. The proposed classification model achieves the 98.98% accuracy (ACC), 98.87% area under the ROC curve (AUC), 98.89% sensitivity (Se), 97.99 % precision (Pr), 97.88% F₁-score, and 1.8974-seconds computational time. 相似文献

18.

基于主成分分析与集成距离的果蔬种类识别方法

马素萍巨志勇王告《电子科技》2019,32(11):1-6

针对传统果蔬识别率较低的问题,文中采用一种基于主成分分析和距离集成kNN相结合的识别方法。该方法从果蔬图像特征描述、特征降维、分类器设计3个角度出发实现果蔬识别。针对果蔬图片光不均匀、存在阴影等问题,采用K-means 聚类与二次分水岭相结合的方法对图片进行分割。针对果蔬识别模型识别率不高的问题,将所提取果蔬图像的颜色和纹理特征组成特征矩阵,采用PCA与集成kNN算法对该矩阵进行归一化及维数约简来得到低维分类特征,以实现对果蔬农产品的分类。试验结果表明,该算法在果蔬种类识别中识别率最高可达92.6%,且对光照变化、视角变化都具有较好的鲁棒性。相似文献

19.

融合双层注意力与多流卷积的肌电手势识别记忆网络

刘聪许婷婷马钰同刘粤孔祥斌胡胜《光电子．激光》2023,34(2):180-189

针对表面肌电信号(surface electromyography, sEMG)手势识别使用卷积神经网络(convolutional neural network, CNN)提取特征不够充分,且忽略时序信息而导致识别精度不高的问题,本文创新性地提出了一种融合双层注意力与多流卷积神经网络(multi-stream convolutional neural network, MS-CNN)的sEMG手势识别记忆网络模型。首先,利用滑动窗口生成的表面肌电图像作为该模型的输入;然后在MS-CNN中嵌入通道注意力层(channel attention module, CAM),弱化无关信息,使网络能够更加专注sEMG的有效特征;其次,通过长短期记忆网络(long short term memory network, LSTM)对输入的特征进行时序上的激励,关注更多sEMG的时序信息,让网络在时间维度上拥有更强的学习能力;最后,采用时序注意力(time-sequence attention, TSA)层对LSTM的状态进行关注,从而更好地学习重要肌肉信息,提高手势识别精度。在NinaPro数据集上... 相似文献

20.

基于多尺度注意力网络的行人属性识别算法

李娜武阳阳刘颖邢琎《激光与光电子学进展》2021,58(4):282-288

为了提高行人属性识别的准确率,提出了一种基于多尺度注意力网络的行人属性识别算法。为了提高算法的特征表达能力和属性判别能力,首先,在残差网络ResNet50的基础上,增加了自顶向下的特征金字塔和注意力模块,自顶向下的特征金字塔由自底向上提取的视觉特征构建;然后,融合特征金字塔中不同尺度的特征,为每层特征的通道注意力赋予不同的权重。最后,改进了模型损失函数以减弱数据不平衡对属性识别率的影响。在RAP和PA-100K数据集上的实验结果表明,与现有算法相比,本算法对行人属性识别的平均精度、准确度、F1性能更好。相似文献