排序方式: 共有35条查询结果,搜索用时 0 毫秒
1.
2.
视觉计算--人类感知能力的延伸 总被引:9,自引:0,他引:9
从20世纪50年代开始,计算机开始被作为实现人工智能和人类感知的工业,借助计算机,人类第一次可以像借助机械实现对体力的延伸一样实现对脑力和感知能力的延伸。从60年代初开始,围绕计算机视觉进行了大量的研究。本文回顾了近40年来计算机视觉研究的进展情况,对其中一一些重要进展包括立体视觉、从各种线索恢复开头以及运动分析主主动视觉等主流技术和方法进行了综述,对计算机视觉技术的主要应用进行了概括。在分析了这 相似文献
3.
探究了从封闭环境到开放世界环境的转变及其对视觉感知(集中于物体识别和检测)与深度学习领域的影响. 在开放世界环境中,系统软件需适应不断变化的环境和需求,这为深度学习方法带来新挑战. 特别是,开放世界视觉感知要求系统理解和处理训练阶段未见的环境和物体,这超出了传统封闭系统的能力. 首先讨论了技术进步带来的动态、自适应系统需求,突出了开放系统相较封闭系统的优势. 接着,深入探讨了开放世界的定义和现有工作,涵盖开集学习、零样本学习、小样本学习、长尾学习、增量学习等5个开放维度. 在开放世界物体识别方面,分析了每个维度的核心挑战,并为每个任务数据集提供了量化的评价指标. 对于开放世界物体检测,讨论了检测相比识别的新增挑战,如遮挡、尺度、姿态、共生关系、背景干扰等,并强调了仿真环境在构建开放世界物体检测数据集中的重要性. 最后,强调开放世界概念为深度学习带来的新视角和机遇,是推动技术进步和深入理解世界的机会,为未来研究提供参考.
相似文献4.
面部特征标定是人脸识别中的一个关键问题.提出了一种基于样例学习的面部特征自动标定(人脸形状自动提取)方法.该方法是基于下面假设提出来的:人脸图像差和形状差之间存在一种近似的线性关系--相似的人脸图像在较大程度上蕴涵着相似的形状.因此,给定标注了特征点的人脸图像学习集,则任意新的输入人脸图像的面部形状可以采用如下方法估计:测量该人脸图像和训练集中图像的相似度,并将同样的相似度用于该人脸图像形状的重建.即:如果输入人脸图像可以表示为训练图像的优化的线性组合,那么同样的线性组合系数就可以直接用于训练集对应形状的线性组合从而得到输入人脸图像的形状.实验表明,该算法相对于其他传统的特征标定算法具有可比的精度和较快的速度.并且,还将此算法扩展到了多姿态情况下,实现了多姿态人脸图像形状的自动提取. 相似文献
5.
6.
在当前主流的基于统计学习和穷举搜索窗口的人脸检测技术中,使用分类器对每个候选窗口进行分类判决之后,会留下多个重合的人脸候选窗口。为了将多个重合窗口合并为一个,提出一种使用矩形环对一个真实人脸的多个具有重合性质的分类器响应候选窗口进行重合范围限定,并合并多个窗口的策略。提出的矩形环合并窗框方法具有简单、易编程的特点,实验表明了该文方法的有效性。 相似文献
7.
许媛媛;阚美娜;山世光;陈熙霖 《中国图象图形学报》2025,30(2):503-517
目的 域适应技术旨在利用有标签的源域信息提升无标签目标域上的任务性能。近期,对比语言—图像预训练模型CLIP(contrastive language-image pre-training)展现出了强大的泛化能力,一些研究将其引入到域适应中,以提升模型在目标域上的泛化能力。然而,目前基于CLIP的域适应方法通常只调整文本模态的特征,保持视觉模态的特征不变,从而导致目标域的性能提升受限。为此,提出了双模态域无关提示引导的图像分类域适应方法DDAPs(dualmodality domain-agnostic prompts)。方法 DDAPs引入了双模态提示学习,即通过文本和视觉提示学习微调文本特征和图像特征,协同处理域差异的问题。一方面,DDAPs致力于学习更具判别性的文本和图像特征,使模型在当前下游分类任务上的性能更好;另一方面,DDAPs通过消除源域和目标域之间的域差异,学习域不变的文本和图像特征,以提升模型在目标域上的性能。以上两个目标可通过添加域无关文本提示模块和域无关视觉提示模块,使用分类损失和对齐损失微调CLIP来实现。对于分类损失,DDAPs利用源域的标签和目标域的伪标签对样本进行分类;而对于对齐损失,DDAPs则通过最大均值差异损失(maximum mean discrepancy,MMD)来对齐源域和目标域的图像特征分布,从而消除图像特征的域差异。结果 本方法既适用于单源域适应,也适用于多源域适应。对于单源域适应,本方法在Office-Home、VisDa-2017及Office-31这3个数据集上进行了实验,分别取得了87.1%、89.6%和91.6%的平均分类准确率,达到了当前最好的性能;对于多源域适应,本方法在Office-Home上进行了实验,取得了88.6%的平均分类准确率。同时,在Office-Home上进行了消融实验,验证了域无关文本提示模块和域无关视觉提示模块的有效性。结论 DDAPs通过域无关的文本和视觉提示模块微调CLIP预训练模型,使模型学习源域与目标域之间域不变且判别性的特征,有效提升了模型在目标域上的性能表现。 相似文献
8.
从1956年提出人工智能概念至今已经60多年,其间经历了多次兴衰,逐渐走向成熟。人工智能也从一个概念、愿景逐渐成为现实,渗透到生产和生活的方方面面。1人工智能的兴衰1956年在Dartmouth College的夏季讨论班被公认为是人工智能的开端,之后的黄金十年为人工智能的发展奠定了重要的基础。博弈、机器翻译、通用问题求解、模式识别等在这一时期取得了显著的进步,同时也激起研究者和整个社会对这一领域过高的预期。 相似文献
9.
机顶盒——数字化革命的渡船 总被引:1,自引:0,他引:1
<正> 机顶盒有时也称顶置盒,是广播媒介实现数字化后接收端的重要设备。早期的机顶盒是指放在电视机上可以由观众通过遥控器或按键控制的电视节目接受与转换装置。这种装置主要用来控制某些收费节目的收看。近年来,随着广播电视节目的数字化以及因特网的迅速普及,机顶盒已从单一的解密收费装置发展成为集解压缩、因特网浏览、解密收费、交互控制为一体的数字化装置。 相似文献
10.
本文主要介绍了某设备数字压力表的设计思路以及设计内容,包括压力信号采集、电源管理、温度补偿的处理、中央控制等。具有精度高、读数简单等特点。提高了某设备的保障效率。某设备作为某型飞机地面维修和飞行保障的主要资源,是直接影响某型飞机各项作战功能发挥的重要因素。由于某型飞机具有微量保障特点,现有的机械压力表量程一般较大,且精度低,读数容易出现偏差,将对某设备的正常保障产生一定影响。因此需要设计一款符合某设备保障需求的数字压力表,能够准确、有效地对某型飞机实施保障,对飞行训练和作战任务具有重要意义。 相似文献