首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
对网站图像敏感信息识别检测问题,提出一种基于改进深度学习的图像敏感信息识别方法。通过特征融合网络,将经全局优化后的区域检测网络与全局识别网络提取特征相融合,并引入注意力机制,对图像中包含敏感部位的区域进行加权聚焦,提高模型检测效率和准确性。实验证明,采用通过全局特征优化后的区域检测网络,平均检测精度提高1%,相较于SSD、Faster R-CNN等目标生成网络,平均检测精度高8.54%与10.63%,提取结果更精准;融合局部特征的全局识别网络,识别精度随着局部特征提取准确度上升而上升,当提取种类到达10种时,识别精度比未加入高1.8%;通过引入注意力机制,本模型检测准确率提升明显,当聚焦点数为7时,比未引入高0.7%;最终,相较于未包含局部特征的ResNet50网络、虽然未包含局部特征但结构更复杂的ResNet101网络,与虽然考虑局部特征,但未与全局特征进行融合的DMCNet网络,本模型检测准确率平均高出3.25%、2.15%和6%,且耗费时间较短,具有更高的鉴别力和检测效率。  相似文献   

2.
谢斌红  秦耀龙  张英俊 《计算机工程》2022,48(3):244-252+262
在场景文本检测领域,存在由于文本尺寸波动较大导致的小文本漏检、大文本欠检测和多尺度文本边界检测错误的情况。针对上述问题,提出一种基于学习主动中心轮廓模型的场景文本检测网络。在残差网络ResNet的基础上构建多尺度特征权重融合模型,对输入的场景文本图片进行多尺度特征提取和权重融合,并计算出最终的特征融合图,适应场景文本长宽比变化较大的情况。在此基础上,将融合后的特征图输入到学习主动中心轮廓模型预测文本框的中心点和边界,该模型为场景文本检测提供丰富先验知识,以解决多尺度文本检测框包含过多背景或部分包围文本造成的边界检测错误问题。在MSRA-TD500、IC13、IC15和IC17MLT数据集上的实验结果表明,该网络能够提高多尺度场景文本检测的准确率,其中在MSRA-TD50数据集上F-measure为0.83,相较于MSR方法提升1%,在IC13数据集上F-measure为0.91,相较于PixelLink网络提升2%,在IC15数据集上F-measure值为0.87,相较于PSENet网络提升1%,在IC17MLT数据集上F-measure值为0.74,相较于TridentNet网络提升1%。  相似文献   

3.
针对驾驶疲劳瞌睡检测识别效果不佳及被试差异性所致的性能不稳问题,该文提出了一种使用单通道脑电信号进行瞌睡检测与预警的模型架构。首次利用注意力熵刻画清醒与瞌睡状态对应脑电动态演化的复杂度。使用小波包分解法提取相对能量特征,采用Relief算法筛选出适合不同个体的显著时频特征。最后将融合特征矢量送入支持向量机完成分类判别。将所提方法在脑电公开数据集上进行验证,得到95.9%的准确率及96.8%的敏感度。在LabVIEW平台上进行了虚拟仪器的设计,结果表明,所提方法可为驾驶疲劳的检测与预警设备开发提供有效模型。  相似文献   

4.
针对传统的恶意代码检测方法存在成本过高和检测结果不稳定等问题,提出一种基于深度可分离卷积的多神经网络恶意代码检测模型。该模型使用深度可分离卷积(DSC)、SENet(Squeeze-and-Excitation Network)通道注意力机制和灰度共生矩阵(GLCM),通过三个轻型神经网络与灰度图像纹理特征分类并联检测恶意代码家族及其变种,将多个强分类器检测结果通过朴素贝叶斯分类器融合,在提高检测准确率的同时减少网络计算开销。在MalVis+良性数据的混合数据集上的实验结果表明,该模型对恶意代码家族及其变种的检测准确率达到97.43%,相较于ResNet50、VGGNet模型分别提高了6.19和2.29个百分点,而它的参数量只有ResNet50模型的68%和VGGNet模型的13%;在malimg数据集上该模型的检测准确率达到99.31%。可见,所提模型检测效果较好,且参数量也有所降低。  相似文献   

5.
在实体关系抽取任务中,通常采用远程监督(distant supervision,DS)数据集,远程监督方法能通过大规模语料库自动标注数据来扩张数据集,但这无疑会使数据集充满大量的噪声。为此,该文将深度残差网络(deep residual network,ResNet)应用到关系提取的远程监督数据集上,通过加深网络层数来提高模型降噪能力。同时,提出了Gate模块,有效提高了深度残差网络的性能。该模块可以学习到每个特征通道的重要性,通过权重增强或抑制各个特征通道的比重,从而防止过拟合。另外,为了进一步解决数据集降噪问题,还提出了一种双池化层的池化层新方案。实验结果表明所提方法相比于目前效果较好的PCNN+ATT模型,在准确率和召回率上都有3%左右的提升。  相似文献   

6.
针对目前沥青路面裂缝检测存在的识别率低和细微裂缝在复杂背景下难以检测的问题, 提出了基于改进Faster-RCNN的裂缝检测方法. 首先, 通过多功能路面检测车采集路面图像, 将13 000张图片按8:2的比例分为训练集和测试集来建成路面裂缝检测数据集; 然后分别采用VGG16、MobileNet-V2和ResNet50网络替换Faster-RCNN模型中的特征提取网络对裂缝进行识别, 结果表明, ResNet50与Faster-RCNN结合对裂缝的检测准确率达到0.805 8, 效果最好; 裂缝都分布在同一水平面上, 不存在层次信息, 因此将ResNet系列其它网络与Faster-RCNN模型结合, 以期得到更好的检测效果, 结果表明, 相比于ResNet18和ResNet101, 还是ResNet50检测性能最好; 由于还存在细微裂缝漏检的问题, 将CBAM模块引入ResNet50, 并且比较不同插入位置对检测准确率的影响. 实验表明, 改进的Faster-RCNN模型检测精准度达到85.64%, 能有效检测出复杂背景下的细微裂缝.  相似文献   

7.
针对深度伪造视频检测存在的面部特征提取不充分的问题,提出了改进的ResNet(i_ResNet34)模型和3种基于信息删除的数据增强方式.首先,优化ResNet网络,使用分组卷积代替普通卷积,在不增加模型参数的前提下提取更丰富的人脸面部特征;接着改进模型虚线残差结构的shortcut分支,通过最大池化层完成下采样操作,减少视频帧中人脸面部特征信息的损失,然后在卷积层后引入通道注意力层,增加提取关键特征通道的权重,提升特征图的通道相关性.最后,利用i_ResNet34模型对原数据集及3种基于信息删除的数据增强方式扩充后的数据集进行训练,其在FaceForensics++的两类数据集Face-Swap和Deepfakes上的检测准确率分别达到了99.33%和98.67%,优于现有的主流算法,从而验证了所提方法的有效性.  相似文献   

8.
深度学习方法在病灶检测任务中被广泛应用,但因肝脏肿瘤较小和样本较少的问题,导致无法达到辅助诊断的准确率要求。针对以上问题,提出基于ConA-FPN的肝脏肿瘤检测算法,具体过程为:使用融合ResNet和注意力机制的特征金字塔替换Faster R-CNN中的特征提取网络;使用融合特征解决特征金字塔中的高层模块通道信息损失问题,通过添加CAG注意力机制解决了特征融合带来的特征混叠问题,增强模型对小肿瘤的检测能力;使用迁移学习和数据增强提升模型在小数据集上的检测能力和泛化能力。实验结果表明,ConA-FPN在LITS2017和3D-IRCADB上的平均精度达到87.43%,明显优于主流检测模型。  相似文献   

9.
花卉识别在生活中有重要的应用和研究价值。目前传统的花卉识别方法都是通过人工手动选择多个特征进行分类,存在识别准确率低、泛化能力较弱和分类时间长等问题。由于不同的花朵之间存在相似度,通过对每张图片随机变化,增强数据集,把花卉作为研究对象,提出了一种基于ResNet18网络模型优化的花卉识别方法。将ResNet18网络模型中残差块的基础卷积替换为空洞卷积,提取花卉图片更多的细节特征来实现高精度,接着在每个残差块后分别加入经过改进的通道注意力机制优化网络权重,构造改进的ResNet18网络模型,在Oxford 102 Flowers牛津花卉数据集上的实验进行了仿真。实验结果显示,在Oxford 102 Flowers牛津花卉数据集上ResNet网络模型相较于基础AlexNet、VGG-16网络模型准确率高。改进的ResNet网络模型识别精度可以高达97.78%,比仅使用空洞卷积的模型提高了3.11个百分点,比原模型提高了4.45个百分点。改进的ResNet18网络模型在花卉识别的泛化和拟合能力有显著的提高。  相似文献   

10.
针对当前转子焊锡缺陷检测准确率较低的问题,提出了一种基于改进ResNet的两阶段训练网络模型。首先在主干网络引入SRM注意力机制,提高网络对色泽纹理的特征提取能力,通过改进的相似度损失函数训练特征编码器,然后再通过添加分类头的方法进行微调训练出最终的网络模型。将提出的方法用于转子焊锡缺陷检测,并与经典的ResNet网络等比较,实验证明,采用所提出的方法准确率可达到97.6%,明显优于经典的ResNet等分类方法,具有一定的应用价值。  相似文献   

11.
针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图像的特征;然后,针对从头开始训练导致的训练成本过高的问题,使用迁移学习(TL)来改进MobileNetV2的学习方式以提升抗混淆能力;最后,针对传统深度学习网络计算量大和收敛慢的问题,使用MobileNetV2轻量化卷积网络模型,并结合Ranger21改进训练方式以促进网络迅速收敛。实验结果表明:上述方法对Malimg数据集和DataCon数据集的准确率分别达到了99.26%和96.98%。在malimg数据集相较于AlexNet方法在准确率上平均提升了1.49%,检测效率上平均提升了45.31%;在DataCon数据集相较于集成学习方法准确率平均提升了1.14%。可见,基于改进MobileNetV2的恶意代码分类方法可以提升模型的泛化能力、抗混淆能力与分类效率。  相似文献   

12.
《信息与电脑》2021,(1):21-24
人脸图像年龄估计在社交媒体、零售业务和学术研究等各个领域都具有重要的研究意义。ResNet网络是解决深度网络结构退化问题的一种成熟算法,本文使用ResNet50网络对人脸图像的年龄估计模型进行训练。首先,使用ResNet50网络在大型数据集ImageNet上进行模型预训练;其次,在数据集morph2上训练模型;最后,在数据集morph1上进行模型测试。实验结果表明,ResNet50网络在数据集morph1和morph2上获得较高的估计精度。  相似文献   

13.
行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。受行人姿态、遮挡、光照变化等因素的影响,传统的行人重识别方法中特征的表达能力有限,导致准确率降低,提出一种融合不同尺度对比池化特征的行人重识别方法。利用残差网络ResNet50提取行人图像的多尺度特征,在网络的不同层次上,通过对输入的特征进行全局平均池化和最大平均池化,将每组平均池化特征和最大池化特征相减,对相减得到的差异特征与最大池化特征进行相加,获得具有强判别性的对比池化特征。在此基础上,利用三元组损失和交叉熵损失联合优化模型,提高模型的泛化能力,同时采用重排序技术优化网络性能。实验结果表明,该方法在Market1501和DukeMTMC-reID数据集上的首位命中率分别达到96.41%和91.43%,平均精度均值为94.52%和89.30%,相比SVDNet、GLAD和PCB等方法,其行人重识别的准确率较高。  相似文献   

14.
针对传统目标检测模型参数量巨大,制约算法部署与模型推理实时性的问题,提出一种基于改进RetinaNet检测模型的轻量化实时目标检测网络。使用MobileNet-V2代替RetinaNet模型中的ResNet骨干网络,降低整体模型的参数量;设计锚框引导采样机制,基于特征金字塔输出特征层生成感兴趣区域掩码,减少背景区域冗余锚框,降低后处理过程中的计算复杂度;引入GFocalLossV2损失函数统计预测边框分布特征,优化预测边框质量以及提升分类准确度。该模型在自制多类别工件数据集WP和Pascal VOC公开数据集上进行验证实验,改进模型的检测准确率分别达到99.5%、80.5%,检测速度分别达到39.8 FPS、38.3 FPS。实验结果表明,该轻量级目标检测模型能够实现实时检测,同时保证了检测精度。  相似文献   

15.
陈鹏  李鸣  张宇  王志鹏 《测控技术》2022,41(7):17-22
提出了一种结合卷积神经网络和递归神经网络的有效的端到端场景文本识别方法。首先使用特征金字塔(FPN)提取图像的多尺度特征,然后将引入残差网络(ResNet)的深度双向递归网络(Bi-LSTM)对这些特征进行编码,获得文本序列特征,进而引入注意力机制(Attention)对文本序列特征进行解码达到识别效果。在ICDAR2013、ICDAR2015数据集实验验证了该算法的有效性,该方法不仅降低了训练难度,而且提升了网络的收敛速度,提高了文本识别准确率。该方法的有效性在ICDAR2013、ICDAR2015数据集上得到了充分验证。  相似文献   

16.
近年来,基于神经网络的分词模型在封闭领域文本上取得了很高的性能。然而,在领域移植场景下,即测试数据与训练数据的领域差异较大时,分词的性能会显著下降。该文尝试利用自动获取的弱标注数据来提升领域移植场景下的分词性能。首先,对目前性能最好的BiLSTM-CRF分词模型进行扩展,引入适用于弱标注数据的损失函数;进而提出一种简单有效的数据筛选方法,从海量弱标注数据中筛选和目前领域更相关的数据;最后,该文发现数据预处理和在神经网络中引入传统特征均可以有效提高分词性能。在SIGHAN Bakeoff 2010和ZhuXian标注测试集上的实验结果表明,该文所提方法可有效提升汉语分词领域移植性能,平均F值提高了3.6%。  相似文献   

17.
针对无人机地物图像的传统分割方法工程量大,效率低下,深度学习的无人机地物图像分割算法在复杂场景下精度不高和数据集的类别不均衡(长尾数据)等问题,提出一种基于深度学习的高分辨率无人机地物图像分割方法,用于提高不同地貌区域的分割精度。在语义分割模型DeepLabv3的基础上进行改进,将原始主干网络ResNet101替换为ResNet152并添加预训练模型,调整扩张卷积空间金字塔池化模块的扩张率,采用类别平衡损失函数来解决长尾数据问题。在采集的无人机地物图像数据集上进行训练并通过测试集的分割效果证明模型改进方法的有效性。根据实验模型分割效果表明,改进后的方法在测试集上平均交并比达到70.8%,相比原始模型提升了27.2%,能够得到效果更好的分割结果。  相似文献   

18.
邬龙  黎塔  王丽  颜永红 《软件学报》2019,30(S2):25-34
为了进一步利用近场语音数据来提高远场语音识别的性能,提出一种基于知识蒸馏和生成对抗网络相结合的远场语音识别算法.该方法引入多任务学习框架,在进行声学建模的同时对远场语音特征进行增强.为了提高声学建模能力,使用近场语音的声学模型(老师模型)来指导远场语音的声学模型(学生模型)进行训练.通过最小化相对熵使得学生模型的后验概率分布逼近老师模型.为了提升特征增强的效果,加入鉴别网络来进行对抗训练,从而使得最终增强后的特征分布更逼近近场特征.AMI数据集上的实验结果表明,该算法的平均词错误率(WER)与基线相比在单通道的情况下,在没有说话人交叠和有说话人交叠时分别相对下降5.6%和4.7%.在多通道的情况下,在没有说话人交叠和有说话人交叠时分别相对下降6.2%和4.1%.TIMIT数据集上的实验结果表明,该算法获得了相对7.2%的平均词错误率下降.为了更好地展示生成对抗网络对语音增强的作用,对增强后的特征进行了可视化分析,进一步验证了该方法的有效性.  相似文献   

19.
为解决工业控制网络异常流量检测中存在的数据分布不均衡、现有模型检测率低的问题,提出一种基于条件变分自编码器(CVAE)和CatBoost算法的异常流量检测模型。CVAE引入标签信息作为约束条件,控制生成样本的类别。CatBoost算法通过引入无偏估计克服梯度偏差,提高预测的准确性,同时采用多种树的生长方式降低过拟合的风险。使用CVAE进行数据增强,扩充稀有攻击样本,构建分布均匀的平衡数据集。将CatBoost算法作为异常流量检测模型,对Dos、Fuzzers等攻击样本进行精确识别并输出分类结果。实验结果表明:在UNSW-NB15数据集上,利用CVAE进行数据增强后,CatBoost算法对少数类样本的F1值平均提升了25.16个百分点,整体精确率、召回率和F1值分别达到87.85%、87.87%和87.86%;在ZYELL_NCTU NetTraffic_1.0数据集上,利用CVAE进行数据增强后,CatBoost算法对少数类样本的F1值平均提升了16.32%,整体精确率、召回率和F1值均达到99.85%。该模型能够有效避免数据不均衡问题,相较K近邻、随机森林、卷积神经网络等机器学习和深...  相似文献   

20.
针对遥感图像目标检测困难,当前网络难以兼顾检测精度与实时性的问题,提出一种轻量级的遥感图像检测模型Yolov4_Rs。以Yolov4为基准,将轻量级网络Mobilenetv2作为主干特征提取网络,减小模型容量;在网络颈部融入多个特征增强金字塔模块,丰富特征信息;在特征融合网络中去掉下采样,引入残差连接;使用K-means++算法对数据集进行聚类。实验结果表明,Yolov4_Rs体积仅为Yolov4的25.1%,在RSOD和UCAS-AOD数据集上的MAP相比Yolov4分别提升了2.26%、0.99%,表明该模型比Yolov4检测效果更好,是一种轻量高效的检测模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号