排序方式: 共有45条查询结果,搜索用时 0 毫秒
1.
基于卷积神经网络的目标检测在智能机器人、无人机等领域有着重要的应用,但其模型普遍结构复杂、参数量大、占用资源多,难以满足嵌入式目标检测任务中的实时性需求.针对此问题,本文提出一种多尺度特征融合注意力网络(MSFAN:Multi-Scale Feature-fusion Attention Network)模型,该模型基... 相似文献
2.
3.
分数阶傅里叶变换是信号处理与分析的一个重要工具,通过将图像信号投影到不同角度的时频平面可以表征图像的内容信息,其在人脸识别任务中显示出很好的性能。但是分数阶傅里叶变换存在阶次选择的问题,即在没有先验知识的情况下,无法预先知道哪一个阶次的分数阶傅里叶变换域特征具有最好的判别性能。受机器学习中的多核学习理论启发,本文探讨了分数阶傅里叶变换中阶次选择问题和多核学习理论的联系,通过将不同阶次的分数阶傅里叶变化域特征的线性核矩阵作为多核学习网络的输入,结合支持向量机,交替优化更新多核网络中的系数和支持向量机的参数,自动学习多阶次分数阶傅里叶变换域特征的系数,实现多阶次分数阶傅里叶变换域特征的融合。将所提算法应用到人脸识别任务中,在ORL人脸数据集和扩展YaleB人脸数据集上的实验显示所提算法的可行性和有效性。 相似文献
4.
无线传感器网络的关键性基础设施监测系统中,为了检测传感器数据聚合阶段受到的已知的和未知的入侵行为,提出一种自适应监督和聚类混合的入侵检测系统(Adaptively Supervised and Clustered Hybrid Intrusion Detection System, AC-IDS)。系统建立在混合IDS框架的基础上,将传感器聚合数据分类后导入到基于机器学习的误用检测子系统和异常检测子系统,两个子系统分别用来检测已知攻击和未知攻击。实验结果表明,该系统的入侵检出率高达98.9%,检测传感器网络中已知和未知的恶意行为的总准确率约为99.80%。 相似文献
5.
6.
人体动作识别在人机交互、视频内容检索等领域有众多应用,是多媒体信息处理的重要研究方向。现有的大多数基于双流网络进行动作识别的方法都是在双流上使用相同的卷积网络去处理RGB与光流数据,缺乏对多模态信息的利用,容易造成网络冗余和相似性动作误判问题。近年来,深度视频也越来越多地用于动作识别,但是大多数方法只关注了深度视频中动作的空间信息,没有利用时间信息。为了解决这些问题,本文提出一种基于异构多流网络的多模态动作识别方法。该方法首先从深度视频中获取动作的时间特征表示,即深度光流数据,然后选择合适的异构网络来进行动作的时空特征提取与分类,最后对RGB数据、RGB中提取的光流、深度视频和深度光流识别结果进行多模态融合。通过在国际通用的大型动作识别数据集NTU RGB+D上进行的实验表明,所提方法的识别性能要优于现有较先进方法的性能。 相似文献
7.
针对动作识别中如何有效地利用人体运动的三维信息的问题,提出一种新的基于深度视频序列的特征提取和识别方法。该方法首先运用运动能量模型(MEM)来表征人体动态特征,即先将整个深度视频序列投影到三个正交的笛卡儿平面上,再把每个投影面的视频系列划分为能量均等的子时间序列,分别计算子序列的深度运动图能量从而得到运动能量模型(MEM)。然后利用局部二值模式(LBP)描述符对运动能量模型编码,进一步提取人体运动的有效信息。最后用 范数协同表示分类器进行动作分类识别。在MSRAction3D、MSRGesture3D数据库上测试所提方法,实验结果表明该方法有较高的识别效果。 相似文献
8.
针对传统的彩色视频中动作识别算法成本高,且二维信息不足导致动作识别效果不佳的问题,提出一种新的基于三维深度图像序列的动作识别方法。该算法在时间维度上提出了时间深度模型(TDM)来描述动作。在三个正交的笛卡尔平面上,将深度图像序列分成几个子动作,对所有子动作作帧间差分并累积能量,形成深度运动图来描述动作的动态特征。在空间维度上,用空间金字塔方向梯度直方图(SPHOG)对时间深度模型进行编码得到了最终的描述符。最后用支持向量机(SVM)进行动作的分类。在两个权威数据库MSR Action3D和MSRGesture3D上进行实验验证,该方法识别率分别达到了94.90%(交叉测试组)和94.86%。实验结果表明,该方法能够快速对深度图像序列进行计算并取得较高的识别率,并基本满足深度视频序列的实时性要求。 相似文献
9.
10.