首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在SSD(Single shot multibox detector)单阶段人脸检测模型的基础上,针对复杂局部遮挡下人脸检测精确性差的问题,提出了一种基于层级注意力增进网络的多尺寸遮挡人脸检测方法.首先,在SSD基础网络的多层初始特征图上,通过引入注意力增进机制提升人脸可见区域的响应值.然后为不同增强特征层设计不同尺寸...  相似文献   

2.
提出了在复杂背景、不同光照条件下层次式的彩色图像的人脸检测算法。首先,利用颜色补偿技术在YCbCr颜色空间对彩色图像进行肤色分割,选出类似皮肤的区域。然后,通过人脸椭圆形状来检测人脸候选区域。最后,构造眼睛和嘴巴的映射来成功检测出人脸。  相似文献   

3.
简国强  黄竞伟  秦前清  覃志祥 《计算机工程》2005,31(22):181-182,188
针对彩色图像人脸检测,提出了肤色模型和层次支持向量机相结合的人脸检测方法。检测时首先利用调节的肤色模型提取出人脸候选区域,然后对这些候选区域用线性支持向量机和主成分与非线性支持向量机相结合的层次支持向量机进行验证,获得真正的人脸区域。实验表明,该方法对图像偏色有一定的鲁棒性并可以用于灰度图像的人脸检测,而且检测正确率和速度比基于肤色和模板匹配的方法有了一定的改进。  相似文献   

4.
Viola和Jones的人脸检测方法在分类器训练后期,基于Haar-like特征的弱分类器分类能力变弱.针对此问题,提出一种基于Adaboost的分层特征空间的人脸检测方法.该方法让弱分类器在局部和全局特征空间中进行训练,增强弱分类器的分类性能.实验表明,本文方法提高系统的正确检测率,降低错误报警数,与当前人脸检测系统相比性能更优越.  相似文献   

5.
武茜  贾世杰 《计算机工程》2022,48(2):180-185+193
基于深度学习的人脸替换技术取得快速发展,但由DeepFake自动生成的人脸替换图片有可能危害人们的隐私安全。针对DeepFake图片鉴别问题,建立一种基于多通道注意力机制的深度学习鉴别网络模型。将Xception网络作为基础特征提取器,在多通道注意力模块中通过矩阵相乘的思想融合全局和局部的注意力表示,以减少重要信息损失。设计损失函数时添加中心损失,从而提高特征区分度。在训练过程中利用注意力图来引导训练图像的裁剪和去除,以达到数据增强的目的。实验结果表明,相比Xception、B4Att方法,在FaceForensics++数据集上该网络模型对DeepFake的检测精度分别提高0.77和0.45个百分点,在Celeb-DF数据集上分别提高5.30和4.68个百分点。  相似文献   

6.
Visual attention is a mechanism that enables the visual system to detect potentially important objects in complex environment. Most computational visual attention models are designed with inspirations from mammalian visual systems. However, electrophysiological and behavioral evidences indicate that avian species are animals with high visual capability that can process complex information accurately in real time. Therefore, the visual system of the avian species, especially the nuclei related to the visual attention mechanism, are investigated in this paper. Afterwards, a hierarchical visual attention model is proposed for saliency detection. The optic tectum neuron responses are computed and the self-information is used to compute primary saliency maps in the first hierarchy. The "winner-take-all" network in the tecto-isthmal projection is simulated and final saliency maps are estimated with the regularized random walks ranking in the second hierarchy. Comparison results verify that the proposed model, which can define the focus of attention accurately, outperforms several state-of-the-art models. This study provides insights into the relationship between the visual attention mechanism and the avian visual pathways. The computational visual attention model may reveal the underlying neural mechanism of the nuclei for biological visual attention.   相似文献   

7.
事实验证任务要求能够从大规模的文本语料库中抽取相关的证据,并通过推理对给定的声明得出事实性的判断.现有的研究通常将检索到的证据拼接,然后比较声明和证据嵌入的余弦相似度,这些方法忽视了长距离证据之间的联系,以及不同层次的语义相似度,而这些特征对于推理验证至关重要.设计了一种基于图的多层次注意力模型(Graph-aware...  相似文献   

8.
针对现实场景中遮挡人脸检测精度低的问题,提出了一种基于汇聚CNN和注意力增强网络的遮挡人脸检测方法.首先,在主网络的多层原始特征图上,通过有监督学习的方法增强原始特征图中人脸可见部分的响应值.然后,将多个增强特征图组合成附加增强网络与主网络汇聚设置,以加快对多尺度遮挡人脸的检测速度.最后,将有监督信息分散到各个尺寸的特...  相似文献   

9.
人脸检测技术作为一种人员身份识别的主流技术被广泛应用于人们的日常生活中。然而在特定应用场景中,当人脸被遮挡或人脸目标非常密集时,人脸识别的检测性能急剧下降。提出一种基于深度残差网络和注意力机制的高精度人脸检测算法。使用残差网络ResNet-50并结合IoU损失函数提高人脸检测精度,并利用注意力机制优化突出脸部区域特征,在此基础上采用非极大值抑制方法增强算法鲁棒性。在公开FDDB数据集上的实验结果表明,该算法的准确率达到96.1%相比传统卷积网络VGG-16算法提高1.6个百分点。  相似文献   

10.
Machine Intelligence Research - In generative dialog systems, learning representations for the dialog context is a crucial step in generating high quality responses. The dialog systems are required...  相似文献   

11.
文本分类是自然语言处理领域的核心任务之一,深度学习的发展给文本分类带来更广阔的发展前景.针对当前基于深度学习的文本分类方法在长文本分类中的优势和不足,该文提出一种文本分类模型,在层次模型基础上引入混合注意力机制来关注文本中的重要部分.首先,按照文档的层次结构分别对句子和文档进行编码;其次,在每个层级分别使用注意力机制....  相似文献   

12.
随着互联网的发展,基于用户信用的在线服务产品也越来越多地应用到各个领域.在这些信用数据中,除了传统的信贷数据,还包含用户网上消费数据等,因此如何利用这些数据来评估用户的信用等级是一个亟待解决的重要问题.之前的方法主要是基于信贷领域属性的研究,缺乏在互联网领域的研究,并且这些方法很少考虑用户的不同属性对其信用的不同的重要程度.因此,为了解决这些问题,提出一个基于层级注意力机制用户信用评估模型框架(HAM-UCE),模型首先构建用户信用画像,然后利用层级注意力机制在多个注意力层逐步获取更重要的用户属性特征,实现对用户信用等级的评估.实验结果表明该方法能够有效地实现对用户信用进行等级评估,能够比基准算法取得更好的性能.  相似文献   

13.
由于人脸表情图像具有细微的类间差异信息和类内公有信息,提取具有判别性的局部特征成为关键问题,为此提出了一种注意力分层双线性池化残差网络。该模型采用有效的通道注意力机制显式地建模各通道的重要程度,为输出特征图分配不同的权重,按权重值大小定位显著区域。并添加了一个新的分层双线性池化层,集成多个跨层双线性特征来捕获层间部分特征关系,以端到端的深度学习方式在特征图中进行空间池化,使所提网络模型更适合精细的面部表情分类。分别在FER-2013和CK+数据集上对设计的网络进行实验,最高识别率分别为73.84%和98.79%,达到了具有竞争性的分类准确率,适用于细微的面部表情图像识别任务。  相似文献   

14.
跨领域情感分类任务旨在利用已知情感标签的源域数据对缺乏标记数据的目标域进行情感倾向性分析.文中提出基于Wasserstein距离的分层注意力模型,结合Attention机制,采用分层模型进行特征提取,将Wasserstein距离作为域差异度量方式,通过对抗式训练自动捕获领域共享特征.进一步构造辅助任务捕获与共享特征共现的领域独有特征,结合两种特征表示完成跨域情感分类任务.在亚马逊评论等数据集上的实验表明,文中模型仅利用领域共享特征就达到较高的正确率,在不同的跨领域对之间具有较好的稳定性.  相似文献   

15.
针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字—词语—句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。  相似文献   

16.
在全卷积孪生网络跟踪算法(SiamFC)的基础上,提出一种融合注意力机制的孪生网络目标跟踪算法.在网络模板分支,通过融合注意力机制,由神经网络学习模板图像的通道相关性和空间相关性,进而增大前景贡献,抑制背景特征,提升网络对正样本特征的辨别力;同时,使用VggNet-19网络提取模板图像的浅层特征和深层特征,两种特征自适...  相似文献   

17.
认知追踪是一种数据驱动的学习主体建模技术,旨在根据学生历史答题数据预测其知识掌握状态或未来答题表现.近年来,在深度学习算法的加持下,深度认知追踪成为当前该领域的研究热点.针对深度认知追踪模型普遍存在黑箱属性,决策过程或结果缺乏可解释性,难以提供学习归因分析、错因追溯等高价值教育服务等问题,提出一种基于多层注意力网络的认知追踪模型.通过挖掘题目之间多维度、深层次的语义关联信息,建立一种包含题目元素、语义和记录等3层注意力的网络结构,利用图注意神经网络和自注意力机制等对题目进行嵌入表示、语义融合和记录检索.特别是在损失函数中引入提升模型可解释性的正则化项与权衡因子,实现对模型预测性能与可解释强度的调控.同时,定义了预测结果可解释性度量指标——保真度,实现对认知追踪模型可解释性的量化评估.最后,在6个领域基准数据集上的实验结果表明:该方法有效提升了模型的可解释性.  相似文献   

18.
人脸检测中的肤色提取模型研究   总被引:5,自引:0,他引:5  
徐艳  陈孝威 《计算机仿真》2006,23(10):194-198
肤色是人脸区别于其他景物的一个重要特征,基于肤色的人脸检测第一个要解决的问题就是选择合适的肤色提取模型,模型选择的好坏直接影响肤色提取效果,从而影响人脸检测的准确性。该文就近期人脸检测中常用的肤色提取模型进行了简单地分析与比较表明,色度空间中的亮度分量是造成各种模型肤色提取效果不同的主要原因,并针对Anil K.Jain的Cb、Cr椭圆聚类法肤色分割的缺点进行了改进,首先对亮度信息设置阈值,进行分段判断,这样克服了在高亮度区域和亮度较低的区域中存在的不足。实验证明,该文的方法较之其他方法效果要好,在人的眼睛、嘴巴等部分有更好更细致的检测效果。  相似文献   

19.
Xiao  Shaoning  Li  Yimeng  Ye  Yunan  Chen  Long  Pu  Shiliang  Zhao  Zhou  Shao  Jian  Xiao  Jun 《Neural Processing Letters》2020,52(2):993-1003

This work aims to address the problem of video question answering (VideoQA) with a novel model and a new open-ended VideoQA dataset. VideoQA is a challenging field in visual information retrieval, which aims to generate the answer according to the video content and question. Ultimately, VideoQA is a video understanding task. Efficiently combining the multi-grained representations is the key factor in understanding a video. The existing works mostly focus on overall frame-level visual understanding to tackle the problem, which neglects finer-grained and temporal information inside the video, or just combines the multi-grained representations simply by concatenation or addition. Thus, we propose the multi-granularity temporal attention network that enables to search for the specific frames in a video that are holistically and locally related to the answer. We first learn the mutual attention representations of multi-grained visual content and question. Then the mutually attended features are combined hierarchically using a double layer LSTM to generate the answer. Furthermore, we illustrate several different multi-grained fusion configurations to prove the advancement of this hierarchical architecture. The effectiveness of our model is demonstrated on the large-scale video question answering dataset based on ActivityNet dataset.

  相似文献   

20.
基于示例学习的图像人脸检测技术   总被引:3,自引:1,他引:3  
描述了一种基于示例学习的方法来检测具有复杂背景的图像中正面人脸的位置。这项技术使用了图像模型聚类的方式构造了人脸模式的分布。针对每一个图像 ,计算图像局部分布与基于分布的模板之间的特征矢量差异。然后基于这个差异 ,应用一个经过训练的分类器来判断图像当前位置是否有人脸存在  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号