首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
在传统的计算机视觉领域中,底层任务被认为是自主的、自底向上的过程,造成较低的图像识别率。为此,提出一种基于拓扑知觉理论的人脸表情识别方法。该方法把人脸具有拓扑不变性的性质用于人脸拓扑轮廓的提取,将提取的特征与主成分分析相结合,作为人脸大范围特征信息,将大范围优先原理应用于人脸表情的识别算法中,设计RBF+Adaboost多层分类器。实验结果表明,该方法可以提高人脸表情的识别率。  相似文献   

2.
根据拓扑性质知觉原理,视觉原语是从整体到局部,拓扑感知优先。根据此仿生原理,建立感知目标物的形状拓扑信息的数学模型。首先提取物体三维轮廓信息;将空间图形轮廓降维映射到二维投影平面中进行处理;建立提取空间图形拓扑特征的数学模型。将轮廓拓扑空间同胚映射到(Hausdorf或度量空间或)二维投影平面,保持了拓扑不变性,因此便于分析出拓扑特征,可继续应用拓扑映射原理,分析点集拓扑。最终,拓扑特征与知识库模型相匹配,识别出物体。  相似文献   

3.
为了提高复杂场景的碰撞检测效率,提出一种基于拓扑空间网格的碰撞检测算法. 由于场景中存在众多形状复杂、尺寸不一且运动状态不同的物体,首先采取场景预处理对空间进行均匀八叉树网格划分,建立物体方向包围盒层次树与空间网格拓扑结构,利用静态大尺寸物体分割策略提升定位精确性,然后在实时检测中利用拓扑空间网格及投影相交测试排除大量不相交物体对,利用层次包围盒算法对潜在碰撞对进行精确检测并计算出碰撞点. 实验结果表明,本算法有效地提高了实时检测的效率,适用于复杂虚拟场景中的碰撞检测.  相似文献   

4.
以优化图标搜索任务的用户认知模型为目的,通过行为实验研究了搜索任务与视觉元素之间的关系.文中采用响应面分析方法测量了图标阵列、图标线框粗细与搜索反应时的相关关系,构建了搜索反应时与图标阵列大小的线性拟合关系式;依据眼动轨迹、视觉热点图等眼动数据,确认了色彩及形状在视觉引导中的作用,推测出搜索行为中视知觉使用了"分组策略",认知模型的视觉模块包括了自下而上的视觉预加工阶段和目标驱动型的自上而下加工阶段.最后结合理性思维的自适应控制系统模型(ACT-R模型),描述了图标搜索任务的用户认知模型.  相似文献   

5.
基于模糊神经网络的大场景人群密度估计方法 *   总被引:2,自引:0,他引:2  
提出了一种估计大场景下密集人群密度的方法。该方法根据人类视觉的模糊性原理,认为用模糊集来划分人群密度范围比用确定的方法更符合人眼视知觉的认知方式,利用统计的方法确定灰度共生矩阵各指标对于各个密度类别的隶属函数;设计基于误差反向传播训练算法(BP)的模糊神经网络,计算样本模式对于各个密度类别的隶属度,并根据人群密度变化的时域连续性原理对人群密度范围进行合理估计。实验表明该方法提高了估计精度。  相似文献   

6.
基于蛙眼视觉特性的运动目标模糊化区域理解跟踪方法   总被引:1,自引:0,他引:1  
动态场景下的运动目标检测与跟踪是计算机视觉研究的前沿方向, 对场景的背景突变和目标的外观突变 的鲁棒性是当前研究的难点所在. 针对这种情形, 本文提出一种基于蛙眼视觉特性的鲁棒跟踪方法. 该方法利用蛙眼视觉认知的生理特性和外部特性, 设计了一种与之相应的模糊化区域理解的运动目标跟踪方法. 针对实验室环境下的动态序列的实验结果验证了方法的有效性; 并进一步将该方法与传统的Canny算子理解结 果及经典的Mean shift算法理解结果进行对比, 显示了方法的优越性.  相似文献   

7.
对观众视知觉的研究和应用有助于博物馆整体照明品质的提升,国家博物馆和首都博物馆在自然光利用和展品照明两方面提供了研究实例。博物馆建筑在积极采用自然光的同时忽视了展览性质和观众视觉心理需求,影响到展览空间氛围的营造和展示信息的传达;重点照明忽视展品阴影的价值,依据观者视知觉习惯,物体阴影可在突出展品形体、表征展品文脉等方面发挥积极作用。  相似文献   

8.
基于记忆机制的视觉信息处理认知建模   总被引:2,自引:0,他引:2  
受人类认知环境方式的启发,将人类记忆机制引入到视觉信息处理过程,提出一种基于记忆机制的视觉信息处理认知模型,用于模拟人脑的一些认知过程。该模型主要包括5个部分:信息粒、记忆空间、认知行为、信息传递规则和决策过程。根据人脑三阶段记忆模型定义3个记忆空间:瞬时记忆空间、短时记忆空间和长时记忆空间,分别用于存储当前的、临时的和永久的视觉信息。该模型可记住或遗忘曾经出现过的场景,从而使其能快速适应场景变化。将其应用于计算机视觉研究中的两个关键问题:背景建模与运动目标跟踪。实验结果表明,该模型能较好解决复杂场景下背景或目标姿态突变以及目标被严重遮挡等问题。  相似文献   

9.
一种大范围复杂场景的快速绘制算法   总被引:1,自引:0,他引:1  
文章对如何提高大范围复杂场景的显示速度进行分析,利用物体的空间拓扑结构对空间场景进行预裁剪,同时,建立了合适的模型调度策略,并将两者相结合给出了一个大范围场景的快速绘制算法。文中用一个实际应用说明该文提供的绘制算法的有效性。  相似文献   

10.
王璐  李玉玲  蔡自兴 《计算机应用》2006,26(9):2034-2037
针对移动机器人在未知环境中的导航问题,提出并实现一个新的基于视觉显著区域的拓扑定位系统。首先采用中心—周围差方法在多尺度图像空间中计算颜色及纹理对比,根据检测出的显著线索构造适宜尺寸的显著区域。然后将这些场景中的视觉显著区域利用隐马尔科夫模型组织成为拓扑图中的一个顶点,从而将定位问题转化为隐马尔科夫模型(HMM)的估值问题。该系统支持机器人在线建立环境的拓扑模型,同时进行定位。实验结果表明,该方法能够在机器人移动过程中发生尺度、2维旋转、视角等变化时稳定地检测出显著视觉区域,场景识别率较高。实验证明该定位系统有能力保证机器人在未知环境中的安全导航。  相似文献   

11.
Along with the improvement of eye-tracking technology, more and more distinct field of researches have introduced movements of the eye in relation to the head to understand user behavior. Most of current researches focus on the perception process of single 2-dimensional images by fixed eye-tracking devices or the head-mount devices. A method of applying eye-tracking on the analysis of the interaction between users and objects in 3D navigational space is proposed in this article. It aims to understand the visual stimulation of 3D objects and the user’s spatial navigational reactions while receiving the stimulation, and proposes the concept of 3D object attention heat map. It also proposes to construct a computational visual attention model for different geometric featured 3D objects by applying the method of feature curves. The VR results of this study also provide future assistance in the incoming immersive world. This study sets to promote eye-tracking from the mainstream of 2D field to 3D spaces and points to a deeper understanding between human and artificial product or natural objects. It would also serve an important role in the field of human-computer interaction, product usability, aids devices for cognition degenerative individuals, and even the field of visual recognition of daily human behavior.  相似文献   

12.
针对移动镜头下的运动目标检测中的背景建模复杂、计算量大等问题,提出一种基于运动显著性的移动镜头下的运动目标检测方法,在避免复杂的背景建模的同时实现准确的运动目标检测。该方法通过模拟人类视觉系统的注意机制,分析相机平动时场景中背景和前景的运动特点,计算视频场景的显著性,实现动态场景中运动目标检测。首先,采用光流法提取目标的运动特征,用二维高斯卷积方法抑制背景的运动纹理;然后采用直方图统计衡量运动特征的全局显著性,根据得到的运动显著图提取前景与背景的颜色信息;最后,结合贝叶斯方法对运动显著图进行处理,得到显著运动目标。通用数据库视频上的实验结果表明,所提方法能够在抑制背景运动噪声的同时,突出并准确地检测出场景中的运动目标。  相似文献   

13.
Notwithstanding the recent diffusion of the stereoscopic 3D technologies for the development of powerful human computer interaction systems based on augmented reality environment, with the conventional approaches an observer freely moving in front of a 3D display could experience a misperception of the depth and of the shape of virtual objects. Such distortions can cause eye fatigue and stress for entertainment applications, and they can have serious consequences in scientific and medical fields, where a veridical perception of the scene layout is required. We propose a novel technique to obtain augmented reality systems capable to correctly render 3D virtual objects to an observer that changes his/her position in the real world and acts in the virtual scenario. By tracking the positions of the observer’s eyes, the proposed technique generates the correct virtual view points through asymmetric frustums, thus obtaining the correct left and right projections on the screen. The natural perception of the scene layout is assessed through three experimental sessions with several observers.  相似文献   

14.
Intelligent visual surveillance — A survey   总被引:3,自引:0,他引:3  
Detection, tracking, and understanding of moving objects of interest in dynamic scenes have been active research areas in computer vision over the past decades. Intelligent visual surveillance (IVS) refers to an automated visual monitoring process that involves analysis and interpretation of object behaviors, as well as object detection and tracking, to understand the visual events of the scene. Main tasks of IVS include scene interpretation and wide area surveillance control. Scene interpretation aims at detecting and tracking moving objects in an image sequence and understanding their behaviors. In wide area surveillance control task, multiple cameras or agents are controlled in a cooperative manner to monitor tagged objects in motion. This paper reviews recent advances and future research directions of these tasks. This article consists of two parts: The first part surveys image enhancement, moving object detection and tracking, and motion behavior understanding. The second part reviews wide-area surveillance techniques based on the fusion of multiple visual sensors, camera calibration and cooperative camera systems.  相似文献   

15.
目的 视觉感知技术是智能车系统中的一项关键技术,但是在复杂挑战下如何有效提高视觉性能已经成为智能驾驶领域的重要研究内容。本文将人工社会(artificial societies)、计算实验(computational experiments)和平行执行(parallel execution)构成的ACP方法引入智能驾驶的视觉感知领域,提出了面向智能驾驶的平行视觉感知,解决了视觉模型合理训练和评估问题,有助于智能驾驶进一步走向实际应用。方法 平行视觉感知通过人工子系统组合来模拟实际驾驶场景,构建人工驾驶场景使之成为智能车视觉感知的“计算实验室”;借助计算实验两种操作模式完成视觉模型训练与评估;最后采用平行执行动态优化视觉模型,保障智能驾驶对复杂挑战的感知与理解长期有效。结果 实验表明,目标检测的训练阶段虚实混合数据最高精度可达60.9%,比单纯用KPC(包括:KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute),PASCAL VOC(pattern analysis,statistical modelling and computational learning visual object classes)和MS COCO(Microsoft common objects in context))数据和虚拟数据分别高出17.9%和5.3%;在评估阶段相较于基准数据,常规任务(-30°且垂直移动)平均精度下降11.3%,环境任务(雾天)平均精度下降21.0%,困难任务(所有挑战)平均精度下降33.7%。结论 本文为智能驾驶设计和实施了在实际驾驶场景难以甚至无法进行的视觉计算实验,对复杂视觉挑战进行分析和评估,具备加强智能车在行驶过程中感知和理解周围场景的意义。  相似文献   

16.
针对大型产品虚拟装配环境中的场景漫游问题,提出一种简单且高效的视点运动 控制策略。以认知心理学和人机工程学理论为指导,首先建立人手作业空间,然后对作业空间 进行功能划分,分为对象操作区和视点漫游区,最后在功能分区的基础上建立人手运动感知与 视点运动控制的映射模型。通过实验证明,操作者对大型产品进行虚拟装配的过程中,可以轻 松地利用该方法实现场景漫游,进而实现虚拟环境中对象操作和场景漫游的无缝集成。  相似文献   

17.
视觉感受野(Visual receptive field)模型作为生物视觉感知计算的基础单元,在整个生物视觉信息加工过程中发挥着重要作用.借鉴具有运动视觉特长的生物感受野特性研究高效的运动视觉计算技术,是一种潜在可行的方法.本文基于蛙眼R3细胞感受野,在高斯差分模型(Difference of Gaussians, DOG)的基础上引入时间和空间各向异性的运动视觉表达方式, 提出一种基于蛙眼R3细胞的不对称各向异性感受野(Asymmetric anisotropy receptive field, AARF)模型,表达蛙类视觉系统对运动目标敏感的视觉时空特征.基于该运动视觉模型,进一步提出了一种面向序列图像运动目标分析的蛙眼时空运动滤波算子(Frog-based spatio-temporal motion filter, FSTMF),以实现运动目标准确检测与分析.实验结果表明,该方法具有使序列图像背景模糊、动态目标突显的滤波效果,既符合蛙眼视觉背景模糊而前景清晰的特性,也为下一步运动目标的准确检测实现了高效的预处理.  相似文献   

18.
In the real world, vision operates in harmony with self-motion yielding the observer to unambiguous perception of the three-dimensional (3D) space. In laboratory conditions, because of technical difficulties, researchers studying 3D perception have often preferred to use the substitute of a stationary observer, somehow neglecting aspects of the action-perception cycle. Recent results in visual psychophysics have proved that self-motion and visual processes interact, leading the moving observer to interpret a 3D virtual scene differently from a stationary observer. In this paper we describe a virtual environment (VE) framework which presents very interesting characteristics for designing experiments in visual perception during action. These characteristics arise in a number of ways from the design of a unique motion capture device. First, its accuracy and the minimal latency in position measurement; second, its ease of use and the adaptability to different display interfaces. Such a VE framework enables the experimenter to recreate stimulation conditions characterised by a degree of sensory coherence typical of the real world. Moreover, because of its accuracy and flexibility, the same device can be used as a measurement tool to perform elementary but essential calibration procedures. The VE framework has been used to conduct two studies which compare the perception of 3D variables of the environment in moving and in stationary observers under monocular vision. The first study concerns the perception of absolute distance, i.e. the distance separating an object and the observer. The second study refers to the perception of the orientation of a surface both in the absence and presence of conflicts between static and dynamic visual cues. In the two cases, the VE framework has enabled the design of optimal experimental conditions, permitting light to be shed on the role of action in 3D visual perception.  相似文献   

19.
视频监控的广泛应用使运动对象检测成为研究热点,但运动的不确定性增加了检测难度。鉴于人类视觉系统能高效地感知运动对象,研究者从神经生理学和心理学的角度提出了运动检测的生物学模型。根据上述研究成果,提出模拟初级视皮层的运动对象检测模型。使用三维Gabor时空滤波器模拟人类初级视皮层中简单细胞的经典感受野,通过非线性组合获取复杂细胞对运动对象刺激响应的运动能量,应用细胞的中心环绕作用及相关性运动检测增强运动信息并抑制环境干扰,采用信息融合获取运动对象的显著性图,并利用WTA神经网络模型实现对运动H标的感知。实验结果表明,该模型能有效检测到视频中的运动目标,运算速度较其他仿视神经加工的视觉注意模型更快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号