共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
目的 经典的人眼注视点预测模型通常采用跳跃连接的方式融合高、低层次特征,容易导致不同层级之间特征的重要性难以权衡,且没有考虑人眼在观察图像时偏向中心区域的问题。对此,本文提出一种融合注意力机制的图像特征提取方法,并利用高斯学习模块对提取的特征进行优化,提高了人眼注视点预测的精度。方法 提出一种新的基于多重注意力机制(multiple attention mechanism, MAM)的人眼注视点预测模型,综合利用3种不同的注意力机制,对添加空洞卷积的ResNet-50模型提取的特征信息分别在空间、通道和层级上进行加权。该网络主要由特征提取模块、多重注意力模块和高斯学习优化模块组成。其中,空洞卷积能够有效获取不同大小的感受野信息,保证特征图分辨率大小的不变性;多重注意力模块旨在自动优化获得的低层丰富的细节信息和高层的全局语义信息,并充分提取特征图通道和空间信息,防止过度依赖模型中的高层特征;高斯学习模块用来自动选择合适的高斯模糊核来模糊显著性图像,解决人眼观察图像时的中心偏置问题。结果 在公开数据集SALICON(saliency in context)上的实验表明,提出的方法相较于同结... 相似文献
3.
针对无人机航拍图像中目标小、尺度不一和背景复杂等导致检测精度低的问题,提出一种基于改进YOLOv5的无人机航拍图像目标检测算法DY-YOLOv5。该算法在检测头部分利用具有多重注意力机制的目标检测头方法Dynamic Head,提升检测头在复杂背景下的检测表现。在原模型neck部分增加一次上采样和Concat操作,并执行一个包含极小、小、中目标的多尺度特征检测,提升模型对中、小目标的特征提取能力。引入密集卷积网络DenseNet,将其与YOLOv5s主干网络的C3模块进行融合,提出C3_DenseNet模块,以加强特征传递并预防模型过拟合。在VisDrone2019数据集上应用DY-YOLOv5算法,平均精度均值(mAP)达到了43.9%,较原YOLOv5算法提升了11.4个百分点。召回率(Recall)为41.7%,较原算法提升了9.0个百分点。实验结果证明,改进算法显著提高了无人机航拍图像目标检测的精度。 相似文献
4.
机器阅读理解是当下自然语言处理的一个热门任务,其内容是: 在给定文本的基础上,提出问题,机器要在给定文本中寻找并给出最终问题的答案。片段抽取式阅读理解是当前机器阅读理解研究的一个典型的方向,机器通过预测答案在文章中的起始和结束位置来定位答案。在此过程中,注意力机制起着不可或缺的作用。该文为了更好地解决片段抽取式机器阅读理解任务,提出了一种基于多重联结机制的注意力阅读理解模型。该模型通过多重联结的方式,更有效地发挥了注意力机制在片段抽取式机器阅读理解任务中的作用。利用该模型,在第二届“讯飞杯”中文机器阅读理解评测(CMRC2018)的最终测试集上EM值为71.175,F1值为88.090,排名第二。 相似文献
5.
林荣 《电脑编程技巧与维护》2023,(4):144-146
深度学习在图像抠图中发挥着重要作用,但是它容易丢失一些低级语义信息。在此使用U-Net结构搭建生成网络,并在跳跃连接过程中添加瓶颈注意力模块(BAM),能够有效地融合图像的深层特征和浅层特征。同时在编码器与解码器之间添加一个空洞空间金字塔池化模块(ASPP),拓宽感受野,以多个比例捕捉图像的上下文信息。实验结果表明,相比传统的抠图算法,自然图像抠图提取了更多的细节纹理信息,提高了抠图的精度。 相似文献
6.
在CT图像分割的过程中,通常都会先使用窗口技术对图像数据做预处理.然而,由于脏器组织与病变组织密度的不均匀性,使得这种预处理方式并不能完全将无效信息除去而重点关注脏器和病变部位.受注意力机制的启发,本文提出了一种新的CT图像预处理方式.首先,根据专家经验制作标签,计算出组织的空间概率分布,利用概率分布制作出CT蒙版.其... 相似文献
7.
随着知识图谱技术的兴起,利用金融事件大数据中的实体关系来构建金融事件的精准画像成为一个重要的研究方向.通过对金融事件大数据信息进行精准画像,人们可以详细分析金融事件大数据中的属性关系,全面了解金融事件的发展态势,从而分析金融市场发展趋势与规律.然而金融事件大数据存在文本数据噪音多、中文语义复杂以及实体关系抽取不准确等研... 相似文献
8.
9.
对摄像机拍摄的爆炸图像进行识别,采用多重分形频谱分析的方法对爆炸产生的烟雾进行边缘检测。针对爆炸产生的烟雾图像存在图像存在边缘模糊,形状不确定,具有扩散性等特点,本文对提出了一种基于多重分形的烟雾图像边缘监测方法.实践证明该方法能更好的提取烟雾形成早期的各种特征。 相似文献
10.
随着人工智能和深度神经网络的不断发展,图像生成与编辑变得越来越容易,恶意运用图像生成工具进行篡改伪造的现象层出不穷,这对多媒体安全以及社会稳定造成了极大威胁,因此研究伪造人脸的检测方法至关重要。人脸篡改伪造的方式和工具多种多样,在篡改的过程中可能留下不同程度的篡改痕迹,而这在图像噪声中都有一定程度上的反映。从图像噪声的角度出发,通过噪声去除的方式挖掘反映伪造人脸篡改痕迹的噪声成分,进一步生成噪声注意力,指导主干网络进行伪造人脸检测。使用SRM滤波监督噪声去除模块的训练,并将噪声去除模块所得到的噪声再次加入真实人脸图像中,形成一对有监督的训练样本,通过自监督的方式对噪声去除模块进行加强指导,实验结果说明噪声去除模块得到的噪声特征具有较好的区分度。在多个公开数据集上进行了实验,所提方法在Celeb-DF数据集上达到98.32%的准确率,在FaceForensics++数据集上达到94%以上的准确率,在DFDC数据集上达到92.61%的准确率,证明了所提方法的有效性。 相似文献
11.
股票市场是金融市场关键组成部分,因此对股票市场波动的研究对合理化控制金融市场风险、提高投资收益提供了重要支持,一直以来都是学术界和相关业界的关注焦点,然而,股票市场会受到各种因素的影响。面对股票市场中多源化、异构化的信息,如何高效挖掘、融合股票市场的多源异构数据具有挑战性。为了充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络来预测股票市场的价格波动。首先,引入关系维度构建股票市场交易数据和新闻文本的异构子图,并利用多重注意力机制实现图数据的融合;其次,通过图神经网络门控循环单元(GRU)进行图分类,在此基础上完成对股票市场中上证综合指数、沪深300指数、深证成份指数这三个重要指数波动的预测。实验结果表明,从异构信息特性角度,相较于股票市场交易数据,股市新闻信息对于股票价格影响存在滞后性;从异构信息融合角度,所提方法与支持向量机(SVM)、随机森林、多核k-means (MKKM)聚类等算法相比,预测准确率分别提升了17.88个百分点、30.00个百分点和38.00个百分点,并进行了模型交易策略的量化投资模拟。 相似文献
12.
13.
李睿智 《计算机光盘软件与应用》2014,(1):263-264
本文提出了一种基于BP神经网络和多重特征的色情图像检测方法。用已知色情图像块作为BP神经网络的训练样本,再对待检测图像进行分块操作,并提取每个图像块的纹理、形状和颜色特征信息,并使用神经网络进行分类检测。经matlab实验仿真,本算法对色情图像的检测精度可以达到85%。 相似文献
14.
李睿智 《计算机光盘软件与应用》2014,(1)
本文提出了一种基于BP神经网络和多重特征的色情图像检测方法。用已知色情图像块作为BP神经网络的训练样本,再对待检测图像进行分块操作,并提取每个图像块的纹理、形状和颜色特征信息,并使用神经网络进行分类检测。经matlab实验仿真,本算法对色情图像的检测精度可以达到85%。 相似文献
15.
针对目前中文评价情感分析对深层情感语义信息关注较少的问题,提出一种多重注意力的特征融合神经网络模型简称MTA-CBG(Multi-Attention Convolution-BiGRU).传统词向量不能有效解决一词多义的情况,本文构建了自注意力(Self-At-tention)词向量矩阵模型,获取词语间的关联特征.通过... 相似文献
16.
为提升深度卷积神经网络模型检测肺结节的效果,提出一种基于注意力机制的肺结节检测算法。通过空间和通道注意力两种不同粒度与层次的注意力因子增强,提升肺结节检测网络生成的特征映射的质量,达到提升模型性能的目的。在LUNA16公开肺部CT图像数据集上进行大量相关实验,验证了模型的可行性和算法的有效性。 相似文献
17.
针对现有多重分形谱对噪声敏感的问题,该文提出了一种基于多重加权法的多重分形谱算法。并首先介绍了基于测度理论的多重分形谱的定义;然后定义了基于多重加权的概率测度,同时对基于多重加权法的多重分形谱性能进行了分析,最后采取与衬底法、方差法进行仿真比较的方法,进行了线性区间、抗噪声性能和收敛速度的比较。比较结果表明,该算法具有保持和加强图像的局部特性以及突出图像的细微处的特点,不仅克服了多重分形谱对噪声敏感的缺点,而且权重因子收敛快。 相似文献
18.
近年来,研究者们发现基于双分支结构的高光谱图像分类方法可以更有效地提取图像的光谱特征和空间特征用于分类.但在双分支结构中,各分支只侧重于细化、提取光谱特征或空间特征,忽略了对光谱-空间跨维特征交互的研究,且两分支各自提取的部分交互不明显,因此影响了分类的性能.针对这一问题,本文提出了一种基于全局注意力信息交互的高光谱图像分类方法.首先采用密集连接网络分两个分支分别细化图像的光谱特征和空间特征,然后结合全局注意力机制(GAM)得到通道全局注意力特征和空间全局注意力特征,最后通过一个信息交互的模块实现光谱和空间信息的交互,更充分地利用光谱和空间信息实现分类.本文提出的方法分别在Pavia University(PU)和Salinas Valley (SV)两个数据集上进行了实验,相较于其他的4种方法,本文提出的方法在分类性能上取得了明显的提升. 相似文献
19.
针对现有的变电站缺陷图像检测识别算法鲁棒性弱问题,提出一种基于注意力机制学习的变电设备缺陷图像检测识别方法。所提方法以卷积神经网络作为缺陷图像特征提取的骨架网络,融合注意力机制原理,进一步提升缺陷图像特征的可辨识性。首先,构建注意力机制的卷积神经网络特征提取模型,提取不同注意力机制下变电站缺陷图像特征;其次,设计一种自适应特征学习函数,将不同注意力机制下的特征融合成为新的高质量变电缺陷图像特征;最后,将不同注意力机制下的缺陷图像特征输入到分类模型,实现变电站缺陷图像检测。所提方法增强了变电设备缺陷图像检测的准确性与鲁棒性,实验结果显示,所提方法的mAP达到了70.4%。 相似文献
20.
将多重分形理论引入到植物叶片的图像处理中,用数字图像处理与分析技术,重点对葫芦科的4种植物叶片的图像进行处理,通过计算多重分形谱分析植物叶片的特点。该文处理叶片图像的方法,可望在植物分类及农业生产中产生积极意义。 相似文献