排序方式: 共有41条查询结果,搜索用时 0 毫秒
1.
为解决当前多模态情感识别效果不佳的问题,提出了一种基于Transformer与增强信息融合的双源情感识别模型,模型由音视频编码分支网络和双源增强特征融合模块组成。其中,视频编码分支利用MobileViTv2提取每帧视频的空间特征,并通过在Transformer编码器结构中内嵌残差结构,强化各帧短期关联语义信息的提取能力。在音频特征提取部分构建了维度匹配器,避免了潜在异构鸿沟,提高了模型训练的鲁棒性。在音视频特征融合处引入低参数量跨模态注意力机制,从两个角度同时增强特征融合能力。通过对比和消融实验证明了方法在多模态情感识别任务中的有效性。 相似文献
2.
贾振堂 《平顶山工学院学报》1999,(4)
介绍了一种在校园网上实现语音交互(“网络电话”功能)的方法。具体介绍了VC++对音频处理的支持,以及实现谈话权自动切换的技术。 相似文献
3.
无论是在图象识别,还是在基于MPEG-4的图象压缩编码等应用领域,视频对象分割取是其中一个很重要的技术环节,为了在静止背景的情况下,能很好地解决多目标分割的问题,同时能进行单目标的分割,提出了一种鲁棒性较好的视频分割算法,该算法通过对图象序列中每连续3 帧图象进行对称差分,首先检测出目标的运动范围,然后通过对差分结构进行聚类分析来确定该帧图象中视频对象的个数,接着再利用在二值差分图象上收缩的活动轮廓,把视频对象的轮廓精确地包围起来,即得到该帧分割结果;最后利用光流法来对视频对象进行投注跟踪,修正,另外还利用多个图象序列对该方法进行了试验,实验结果表明,在静止背景下,该算法无论是对运动的单目标,还是对运动的多目标,均能较好地从静止背景中分离出来,即能得到理想的分割结果,故具有一定的鲁棒性和实用性。 相似文献
4.
本文讨论了用计算机模拟电工学实验程序的结构及功能,开发了该实验的仿真环境.编写了计算机模拟电工学日光灯提高功率因数方法实验的程序,显示了程序语言的特殊功能。 相似文献
5.
基于冗余机械臂在求逆解过程中无法获得封闭解的问题,针对性地提出了综合改进麻雀搜索算法(CISSA)。首先,在初始化过程中对算法中的种群进行混沌处理,增加种群的丰富度;其次,将自适应动态权重融入到探索者的位置更新公式以及种群中探索者与追随者的数量中,提高算法快速收敛的能力;同时,在迭代过程中引进柯西变异和Tent混沌扰动,提升算法的抗停滞能力;对于越界的个体处理后重新放入种群中,提升算法性能。CISSA在多项指标上明显优于PSO、WOA和GWO等传统群智能算法;将CISSA应用到冗余机械臂逆运动求解,在算法精度上较SSA提高了2~3个数量级,在算法稳定性上较SSA提高了3~4个数量级,说明了CISSA在实际应用的过程中,有收敛快、精度高、稳定性好的特点。 相似文献
6.
随着车牌识别的应用场景不断扩展,处理的图像复杂性也随之提高,车牌检测面临车牌定位困难、检测速度慢和精度低等挑战。为提高光照不均衡、透视变形、雨雾天气、低分辨率等复杂场景下车牌检测的准确率,提出一种基于车牌角点热图的检测网络LPHD-Net。不同于传统模板匹配和目标检测中矩形先验框的方式,该网络通过车牌角点热图和车牌边界向量场的方法对车牌进行检测。在中国城市停车数据集中进行训练和测试,使用目标检测任务中常用的平均精度和召回率对模型的整体性能进行评价。实验结果表明,LPHD-Net模型对多种复杂场境下的车牌检测精确率和速度分别达到99.2%和78 frame/s,较LMAFLPD模型提升1.15个百分点和14 frame/s。同时,其对场景中的多车牌检测也具有较好的检测效果。 相似文献
7.
8.
9.
综合利用人脸特征和活动轮廓技术的人脸检测及跟踪算法 总被引:2,自引:0,他引:2
把基于静态图像分割的人脸检测技术同活动轮廓技术相结合,提出了一种在视频序列中检测和跟踪人脸的算法.它在Y、U、V联合梯度的基础土实施分水岭运算,并利用人脸的宽高比、颜色、结构等特征进行人脸逐级判别,从而确定人脸住置,然后用基于骨架的活动轮廓进行精确定位和帧间跟踪,从而较好地实现了视频序列中的人脸检测与跟踪问题。算法具有较强的鲁棒性,对于运动比较平缓、脸部轮廓比较清晰的情况,可以进行长时间跟踪。本算法在面向内容的可伸缩视频压缩编码系统中得到应用。 相似文献
10.
介绍在基于PC机的PSTN可视电话系统中,应用V.80协议实现多媒体数据实时传输的原理和方法,并详细论述V.80初始化、数据发送接收、流量控制等实际技术问题。 相似文献