排序方式: 共有147条查询结果,搜索用时 15 毫秒
51.
针对公共空间中人脸情绪识别准确率不高的问题,提出一种结合不同感受野和双流卷积神经网络的人脸情绪识别方法。首先建立基于公共空间视频的人脸表情数据集;然后设计一个双流卷积网络,以尺寸为224×224的单帧人脸图像输入卷积神经网络(convolution neural network,CNN),分析图像纹理静态特征;以尺寸为336×336视频序列输入CNN网络,再将提取的特征送入长短期记忆网络(long short term memory network,LSTM)分析局部、全局运动特征;最后通过Softmax分类器将两通道网络的描述子进行加权融合,得到分类结果。结果表明,本文方法能有效利用不同感受野的信息特征清晰识别公共空间的4种典型人脸情绪,识别准确率达88.89%。 相似文献
52.
复杂场景下的群体活动识别是一项具有挑战性的任务,它涉及一组人在场景中的相互作用和相对空间位置关系。针对当前复杂场景下群组行为识别方法缺乏精细化设计以及没有充分利用个体间交互式特征的问题,提出了基于分块注意力机制和交互位置关系的网络框架,进一步考虑个体肢体语义特征,同时挖掘个体间交互特征相似性与行为一致性的关系。首先,采用原始视频序列和光流图像序列作为网络的输入,并引入一种分块注意力模块来细化个体的肢体运动特征;然后,将空间位置和交互式距离作为个体的交互特征;最后,将个体运动特征和空间位置关系特征融合为群体场景无向图的节点特征,并利用图卷积网络(GCN)进一步捕获全局场景下的活动交互,从而识别群体活动。实验结果表明,此框架在两个群组行为识别数据集(CAD和CAE)上分别取得了92.8%和97.7%的识别准确率,在CAD数据集上与成员关系图(ARG)和置信度能量循环网络(CERN)相比识别准确率分别提高了1.8个百分点和5.6个百分点,同时结合消融实验结果验证了所提算法有较高的识别精度。 相似文献
53.
针对轻量级卷积神经网络MobileNet应用于人脸表情识别实时性较差、最小输入尺寸较大、准确率不高等问题,提出一种改进的MobileNet网络模型——M-MobileNet(Modified MobileNet)。M-MobileNet具有比原网络更好的轻量级特性。该网络模型基于一种改进的深度可分离卷积层,不仅具有MobileNet模型中深度可分离卷积减少卷积计算量的特点,还解决了在深度卷积层后可能会导致信息丢失的问题。在分类器选择上,M-MobileNet使用线性支持向量机(SVM)进行人脸表情分类,参数量较MobileNet网络大大减少。在CK+、KDEF数据集及移动端上的实验证明,改进后的MobileNet网络模型具有更好的识别性能。 相似文献
54.
群体情绪识别是人机交互领域的前言课题,针对群体情绪识别准确率的问题,结合卷积神经网络(CNN)与长短期记忆网络(LSTM),提出一种多流CNN-LSTM网络模型学习群体情绪的静态和动态特征。以视频序列的原始图像、视觉显著图形和叠加的光流图像分别作为三个通道的输入,利用CNN网络对空间特征和局部运动特征进行分析,得到的特征图直接输入LSTM网络,进行全局运动特征的学习。最后连接Softmax分类器,对三个通道的Softmax输出进行加权融合,得到分类结果。实验结果表明,本文模型可有效地识别4种典型的群体情绪,且识别率高于已有算法,准确度(ACC)和宏平均精度(MAP)分别最高可达82.6%、84.1%。 相似文献
55.
56.
57.
基于最小二乘准则的模糊估计和图像复原 总被引:1,自引:0,他引:1
在计算光学显微成像技术中,点扩展函数往往是未知的,且不易获取,从而给图像复原带来很大困难。基于最小二乘准则和最优化理论,提出了利用变尺度法的三维点扩展函数参数估计算法;针对传统EM算法存在复原效果细节丢失严重等问题,提出最小二乘共轭梯度三维图像复原算法。算法在点扩展函数参数估计和求解真实图像之间进行交替迭代,从而得到图像的最优估计。实验表明,新算法在较短时间内,能够较准确地估计出点扩展函数参数,并得到较好的复原结果。 相似文献
58.
针对分布式多视点视频编码系统,本文利用视点间存在的固有的对极几何关系计算空域边信息。在此过程中,所得的对极几何的准确度直接影响边信息的质量以及边信息计算中运动搜索范围的大小。为了更准确的估计视点间的对极几何关系,本文提出了基于图像配准的匹配点对优化算法,在对特征点对进行坐标优化调整的同时,剔除了部分相关性小的匹配点对,提高了其匹配精度。将本文的算法所得到的视点间对极几何关系用于分布式多视点视频编码系统中计算空域边信息,并对系统仿真测试。实验结果分析表明:加入了本文提出的特征点对优化算法后,直接通过在对极线上搜索所获取的边信息质量提升超过了2dB;若将搜索范围往对极线垂直方向上扩张,在保持相似重建质量的前提下,基于本文算法的搜索复杂度降低到原来的10%-20%;与同等条件下的MCII算法相比性能提升约0.2~0.7dB。 相似文献
59.
提出一种新的岩石三维图像裂缝提取算法。首先对三维岩石孔隙模型的每个连通分量执行表面重建、拉普拉斯网格平滑、网格简化等操作。根据三角网格面积和网格单位法向量方向特征,将三角网格划分为不同类别。利用形状因子判定每个三角网格类构成的三维空间结构是否具有裂缝特征。对具有裂缝特征的三维空间结构所包含的体素点集执行形态学膨胀操作,并与原始三维岩石孔隙模型连通分量的体素点集进行逻辑与操作,与操作结果即岩石裂缝。实验结果表明,该方法具有较好的裂缝提取效果。 相似文献
60.
视力是群体健康的重要指标之一,是建设健康城市的重要调查内容.传统调查群体视力的方法存在局限.本文采用深度学习的方式分析监控视频中行人的人脸属性,识别公共群体中视力障碍的数量和比例,并且分性别研究,作为区域人群群体健康的样本指标.针对视频中人脸属性的识别问题,引入人脸检测卷积神经网络来检测行人人脸,在此基础上提出了改进的人脸分析卷积神经网络,分别完成性别的识别及是否佩戴眼镜的识别.最后研究建立了以百度地图为基础的区域视力数据展示系统,并在Web端分街道和区域对男女视力障碍比例进行数据可视化展示,为接下来的实际应用打下基础.实验结果及系统展示表明,本文提出的方法能有效识别群体视力障碍情况,为群体视力健康调查工作提供了新思路. 相似文献