排序方式: 共有38条查询结果,搜索用时 15 毫秒
1.
2.
综合利用人脸特征和活动轮廓技术的人脸检测及跟踪算法 总被引:2,自引:0,他引:2
把基于静态图像分割的人脸检测技术同活动轮廓技术相结合,提出了一种在视频序列中检测和跟踪人脸的算法.它在Y、U、V联合梯度的基础土实施分水岭运算,并利用人脸的宽高比、颜色、结构等特征进行人脸逐级判别,从而确定人脸住置,然后用基于骨架的活动轮廓进行精确定位和帧间跟踪,从而较好地实现了视频序列中的人脸检测与跟踪问题。算法具有较强的鲁棒性,对于运动比较平缓、脸部轮廓比较清晰的情况,可以进行长时间跟踪。本算法在面向内容的可伸缩视频压缩编码系统中得到应用。 相似文献
3.
随着车牌识别的应用场景不断扩展,处理的图像复杂性也随之提高,车牌检测面临车牌定位困难、检测速度慢和精度低等挑战。为提高光照不均衡、透视变形、雨雾天气、低分辨率等复杂场景下车牌检测的准确率,提出一种基于车牌角点热图的检测网络LPHD-Net。不同于传统模板匹配和目标检测中矩形先验框的方式,该网络通过车牌角点热图和车牌边界向量场的方法对车牌进行检测。在中国城市停车数据集中进行训练和测试,使用目标检测任务中常用的平均精度和召回率对模型的整体性能进行评价。实验结果表明,LPHD-Net模型对多种复杂场境下的车牌检测精确率和速度分别达到99.2%和78 frame/s,较LMAFLPD模型提升1.15个百分点和14 frame/s。同时,其对场景中的多车牌检测也具有较好的检测效果。 相似文献
4.
为解决当前多模态情感识别效果不佳的问题,提出了一种基于Transformer与增强信息融合的双源情感识别模型,模型由音视频编码分支网络和双源增强特征融合模块组成。其中,视频编码分支利用MobileViTv2提取每帧视频的空间特征,并通过在Transformer编码器结构中内嵌残差结构,强化各帧短期关联语义信息的提取能力。在音频特征提取部分构建了维度匹配器,避免了潜在异构鸿沟,提高了模型训练的鲁棒性。在音视频特征融合处引入低参数量跨模态注意力机制,从两个角度同时增强特征融合能力。通过对比和消融实验证明了方法在多模态情感识别任务中的有效性。 相似文献
5.
本文讨论了用计算机模拟电工学实验程序的结构及功能,开发了该实验的仿真环境.编写了计算机模拟电工学日光灯提高功率因数方法实验的程序,显示了程序语言的特殊功能。 相似文献
6.
无论是在图象识别,还是在基于MPEG-4的图象压缩编码等应用领域,视频对象分割取是其中一个很重要的技术环节,为了在静止背景的情况下,能很好地解决多目标分割的问题,同时能进行单目标的分割,提出了一种鲁棒性较好的视频分割算法,该算法通过对图象序列中每连续3 帧图象进行对称差分,首先检测出目标的运动范围,然后通过对差分结构进行聚类分析来确定该帧图象中视频对象的个数,接着再利用在二值差分图象上收缩的活动轮廓,把视频对象的轮廓精确地包围起来,即得到该帧分割结果;最后利用光流法来对视频对象进行投注跟踪,修正,另外还利用多个图象序列对该方法进行了试验,实验结果表明,在静止背景下,该算法无论是对运动的单目标,还是对运动的多目标,均能较好地从静止背景中分离出来,即能得到理想的分割结果,故具有一定的鲁棒性和实用性。 相似文献
7.
贾振堂 《平顶山工学院学报》1999,(4)
介绍了一种在校园网上实现语音交互(“网络电话”功能)的方法。具体介绍了VC++对音频处理的支持,以及实现谈话权自动切换的技术。 相似文献
8.
9.
介绍了一种利用手机实现可视化远程家电控制的系统和方法.系统分为服务器、家庭控制中心设备和手机三个部分,它们之间通过TCP/IP连接.在传统家电控制技术的基础上,将视频技术引入手机远程控制过程.用户可以在手机屏幕上对看到的设备对象进行自由的操控,操控结果可见. 相似文献
10.
一种基于运动边缘检测的视频对象分割新算法 总被引:6,自引:1,他引:6
利用人眼对运动(时间梯度)和边缘(空间梯度)都特别敏感的视觉特点,把帧间运动变化检测和图像的边缘检测结合起来,提出一种新的运动视频对象分割算法.通过帧间差快速得到运动物体的大致位置,形成差分模板,然后通过边缘检测在差分模板中确定物体的准确边缘,并形成边缘模板.在边缘模板的基础上,利用二值图像下的收缩型活动轮廓算法,可以方便地得到视频对象(VOP)的闭合轮廓曲线(以便进行编码传输和基于形状的检索).同时,设置模板缓冲区以记忆前一时刻的分割结果,从而弥补当前帧的不完整性.该算法对目标的整体运动和局部形变都有较强的适应性,且具有自动消除显露背景以及多目标自动分割包围的能力. 相似文献