期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

A Framework for Reconstruction based Recognition of Partially Occluded Repeated Objects

Ragini Choudhury Santanu Chaudhury J.B. Srivastava 《Journal of Mathematical Imaging and Vision》2001,14(1):5-20

In this paper we propose a reconstruction based recognition scheme for objects with repeated components, using a single image of such a configuration, in which one of the repeated components may be partially occluded. In our strategy we reconstruct each of the components with respect to the same frame and use these to compute invariants.We propose a new mathematical framework for the projective reconstruction of affinely repeated objects. This uses the repetition explicitly and hence is able to handle substantial occlusion of one of the components. We then apply this framework to the reconstruction of a pair of repeated quadrics. The image information required for the reconstruction are the outline conic of one of the quadrics and correspondence between any four points which are images of points in general position on the quadric and its repetition. Projective invariants computed using the reconstructed quadrics have been used for recognition. The recognition strategy has been applied to images of monuments with multi-dome architecture. Experiments have established the discriminatory ability of the invariants. 相似文献

2.

基于胶囊网络在复杂场景下的行人识别

程换新刘文翰郭占广张志浩《计算机技术与发展》2021,(2):75-79

大数据环境下,对行人检测的需求度不断提高,然而视频中的信息越来越丰富,视频中所获取的场景也愈加复杂.在如此背景下,目前大多使用卷积神经网络进行识别,但识别率不高.在原有的胶囊网络模型的基础上,增加了两层卷积层并将胶囊维度进行了扩展,同时使用了动态路由迭代算法,提出了一种基于改进胶囊网络的行人识别模型(PRM-ICN),... 相似文献

3.

基于视听分层模型的实时爆炸场景识别 总被引：1，自引：0，他引：1

庄越挺傅正钢叶朝阳吴飞《计算机辅助设计与图形学学报》2004,16(1):90-97

提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法．首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开,由此得到音频爆炸备选场景．由于大多数爆炸场景均伴随剧烈的视觉突变,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化,得到最后的识别结果。相似文献

4.

基于多尺度图匹配核的场景单字识别方法

史存召王春恒肖柏华张阳高嵩《自动化学报》2014,40(4):751-756

由于自然场景中的文字具有较大的类内间距, 因此识别场景文字具有很大的挑战性. 本文提出了一种基于多尺度图匹配核的场景单字识别方法. 为了利用字符特有的结构特征, 将每幅图像表示为基于不同网格划分的无向图, 通过计算两个无向图之间图匹配的最优能量值来得到两幅图像的相似度, 由于图匹配在计算每个节点的最佳匹配节点时也考虑了相邻节点之间的空间位置约束, 因此可以应对具有一定形变的文字. 通过图匹配得到的两幅图像之间的相似度很适合用来构造支持向量机的核矩阵. 本文将不同尺度网格划分下得到的核矩阵进行多核融合, 使得最终得到的核矩阵更加地鲁棒. 在国际公开场景文字识别数据集Chars74k和ICDAR03-CH上的实验结果表明, 本方法取得了高于国际上已发表的其他方法的单字识别率. 相似文献

5.

一种基于图像的室内大场景自动三维重建系统 总被引：3，自引：1，他引：2

张峰史利民孙凤梅胡占义《自动化学报》2010,36(5):625-633

由于室内场景具有结构化的特点, 如人们习惯的平行、垂直、共线共面等, 在基于图像的室内场景自动重建中, 即使一些小的误差也会导致明显的视觉差异. 文献中对具有高保真的室内场景的自动重建系统尚少有报道. 针对犯罪现场三维复原的具体需求, 本文报道了一种基于图像的室内场景自动重建系统, 包括图像采集平台的标定, 特征点与特征直线的匹配与重建, 以及多视角下重建结果的融合等. 本系统有如下特点: 1)重建过程为全自动, 不需要任何人机交互; 2)直线特征的自动匹配与重建考虑了场景的深度与结构信息, 匹配的正确率及空间直线重建效果得到了显著提高; 3)重建结果的整体优化中, 融合了特征点与特征直线. 大量实验结果表明, 该系统方便实用, 且能得到比较好的重建效果. 相似文献

6.

自然场景中多类目标识别的算法研究

吴士林朱枫《计算机工程与科学》2012,34(3):91-95

为了实现复杂自然场景中多类目标的识别与分割,本文利用条件概率模型(CM)对目标特征进行建模,融合了纹理特征、纹理环境特征和位置特征,并采用场景类别对各类目标间的相互约束关系进行建模,在此基础上研究基于场景类别的条件概率模型(sCM)在多类目标识别与分割中的应用。本文选用Oliva&Torralba数据库对模型进行实验并与国外其他方法进行了比较。实验结果表明,该算法在多类目标识别与分割中取得很好的结果,在提高总体识别率的同时提高了物体边缘部分识别与分割的正确率,更有效地提高了视觉效果。相似文献

7.

Methods for Volumetric Reconstruction of Visual Scenes

Gregory G. Slabaugh W. Bruce Culbertson Thomas Malzbender Mark R. Stevens Ronald W. Schafer 《International Journal of Computer Vision》2004,57(3):179-199

In this paper, we present methods for 3D volumetric reconstruction of visual scenes photographed by multiple calibrated cameras placed at arbitrary viewpoints. Our goal is to generate a 3D model that can be rendered to synthesize new photo-realistic views of the scene. We improve upon existing voxel coloring/space carving approaches by introducing new ways to compute visibility and photo-consistency, as well as model infinitely large scenes. In particular, we describe a visibility approach that uses all possible color information from the photographs during reconstruction, photo-consistency measures that are more robust and/or require less manual intervention, and a volumetric warping method for application of these reconstruction methods to large-scale scenes. 相似文献

8.

CNN and Fuzzy Rules Based Text Detection and Recognition from Natural Scenes

T. Mithila R. Arunprakash A. Ramachandran 《计算机系统科学与工程》2022,42(3):1165-1179

In today’s real world, an important research part in image processing is scene text detection and recognition. Scene text can be in different languages, fonts, sizes, colours, orientations and structures. Moreover, the aspect ratios and layouts of a scene text may differ significantly. All these variations appear assignificant challenges for the detection and recognition algorithms that are considered for the text in natural scenes. In this paper, a new intelligent text detection and recognition method for detectingthe text from natural scenes and forrecognizing the text by applying the newly proposed Conditional Random Field-based fuzzy rules incorporated Convolutional Neural Network (CR-CNN) has been proposed. Moreover, we have recommended a new text detection method for detecting the exact text from the input natural scene images. For enhancing the presentation of the edge detection process, image pre-processing activities such as edge detection and color modeling have beenapplied in this work. In addition, we have generated new fuzzy rules for making effective decisions on the processes of text detection and recognition. The experiments have been directedusing the standard benchmark datasets such as the ICDAR 2003, the ICDAR 2011, the ICDAR 2005 and the SVT and have achieved better detection accuracy intext detection and recognition. By using these three datasets, five different experiments have been conducted for evaluating the proposed model. And also, we have compared the proposed system with the other classifiers such as the SVM, the MLP and the CNN. In these comparisons, the proposed model has achieved better classification accuracywhen compared with the other existing works. 相似文献

9.

基于图像重建的表情识别算法 总被引：1，自引：0，他引：1

下载免费PDF全文

朱明旱罗大庸王一军《中国图象图形学报》2010,15(1):98-102

提出了一种基于图像重建的表情识别算法。首先,用LE（lipschitz embedding）算法提取出训练集中各个对象的表情流形,并建立流形向量与图像向量的映射关系。再通过非线性重建,确定待测图像在流形空间中的坐标。最后,用待测图像在各表情路径上的投影,重建各种表情图像,实现表情识别。该算法解决了各表情流形相互重叠的问题,且对表情强度变化具有鲁棒性。在CohnKanade和CMUAMP人脸库上的结果实验表明,该算法具有较好的表情识别率。相似文献

10.

基于小波重构脸的人脸识别

许高凤丁士圻《数据采集与处理》2009,24(5)

研究了面部图像的小波分解与重构,分析了表情、光照和个体差异对小波多层分解低频近似系数的影响,指出光照变化对低频分解系数影响最大,表情和个体差异的影响次之.在此基础上提出用标准光照和表情人脸的小波低频近似系数替换光照人脸的低频系数来重构受光照影响的脸图像.并用Gabor和离散余弦变换对重构脸进行了特征提取与识别研究.在AR人脸库和自建库上进行_测试,结果表明,该重构方法能有效地去除光照等因素影响,识别效果得到了较大提高. 相似文献

11.

基于角度特征分量特征的步态识别 总被引：1，自引：0，他引：1

刘丽娜吴清江《计算机与数字工程》2010,38(3):135-138

目前,在步态识别技术中多数描述步态特征的方法在非侧面视角下识别效果一般都不够理想,通常会明显低于侧面视角,针对这一问题,文章提出一种以角度特征分量特征作为步态特征的识别方法,提高步态特征的分类能力从而提高识别率。在步态检测部分文章采用基于色度坐标的混合高斯来抑制阴影和消除噪声,步态识别部分使用支持向量机对所提取的角度特征分量特征进行训练和分类,最终在保证侧面视角识别率的情况下同时提高在非侧面视角下的识别效果。相似文献

12.

基于多个手持摄像机的动态场景时空一致性深度恢复

姜翰青章国锋谭平鲍虎军《计算机辅助设计与图形学学报》2013,25(2)

针对现有的动态场景深度恢复方法普遍需要较多数目的同步摄像机才能获得理想深度估计的问题,提出一个能够从2～3个手持摄像机所拍摄的同步视频序列中自动地恢复出高质量的深度图序列的鲁棒、便捷的动态场景稠密深度恢复方法.首先对不同序列同一时刻的图像帧进行匹配以完成每帧的深度初始化,然后采用一种新的双层分割方法在手持摄像机自由移动的情况下将像素进行静动态分类,并对静态和动态像素点采用不同的方式进行时空一致性的深度优化.特别地,文中采用了一个基于多帧统计信息、迭代式的优化框架,使得深度优化与双层分割在该优化框架之下交替迭代地进行,最终实现高质量的动态场景的分割和深度恢复.最后通过各种动态场景实例证明了文中方法的鲁棒性和有效性. 相似文献

13.

基于多种LBP特征集成学习的车标识别

下载免费PDF全文

李哲于梦茹《计算机工程与应用》2019,55(20):134-138

针对车标图像的分类难问题，提出基于多种LBP特征集成学习的车标识别算法。利用车牌与车标的相对位置关系粗定位车标区域；根据车标背景纹理特征使用不同的算子进行边缘检测，进而实现背景消融，采用投影方法精确确定车标位置；将车标图像分块，应用CSLBP算子提取每个像素点邻域特征，将车标所有像素点邻域特征合成精细的纹理特征，运用LBP直方图算法提取车标区域的空间结构特征，再采用SVM和BP分别训练这两种特征，得到投票决策矩阵，利用加权求和的规则融合决策矩阵，构成最优集成分类器，输出车标类别。实验结果表明，该算法的识别率明显优于单一的特征和分类器。相似文献

14.

一种复杂场景下建筑目标识别方法 总被引：2，自引：0，他引：2

下载免费PDF全文

金泰松叶聪颖李翠华刘明业《计算机工程》2007,33(6):198-200

提出了一种基于建筑目标的竖直线特征寻找图像中存在建筑目标区域的方法;考虑了目标特征的相互关系,给出了一种新的模板匹配算法。实验表明：利用该文提出的算法建立的识别系统与其它识别系统相比,大大减少了运算时间,有较好的抗噪声干扰和处理目标被遮挡问题的能力。相似文献

15.

基于多视图绘制的体视重现

李克勋韦穗张子云曹玉茹《计算机工程与应用》2005,41(18):36-38

通过使用规则照相机几何获取的空间透视体生成时极平面图,用计算全息与图像处理技术产生一个全息立体图。在计算全息中采用了基于衍射的光栅条纹生成方法,将视场分为连续的8个区域,每个区域由一个空间频率不同的基本条纹衍射生成,然后用全息条纹实现简单景物具有视差的3D体视重现。相似文献

16.

基于多语义融合的反讽识别

樊小超杨亮林鸿飞刁宇峰申晨楚永贺《中文信息学报》2021,35(6):103-111

反讽是一种复杂的语言现象,被广泛应用于社交媒体中.如何让计算机具有识别反讽的能力,成为了自然语言处理研究领域的热门研究内容之一.该文针对反讽识别中缺乏上下文语境信息和修辞表达信息的问题,提出了基于多语义融合的反讽识别方法.该方法采用ELMo从大规模反讽文本中训练得到领域词嵌入表示,并融合基于词性和基于风格信息的语义表示... 相似文献

17.

Recognition of Complex Settings by Aggregating Atomic Scenes

Dargie W. Tersch T. 《Intelligent Systems, IEEE》2008,23(5):58-65

This approach imitates human reasoning to enable flexible context recognition. Its usefulness is demonstrated by employing audio-signal processing to recognize several everyday situations. 相似文献

18.

一种智能手机上的场景实时识别算法

桂振文陈靖刘越王涌天《自动化学报》2014,40(1):83-91

目前常用的SIFT和SURF识别算法存在匹配时间长、运算量大和内存占用多等问题,无法满足实时移动检索应用. 针对这些问题,本文提出了一种智能手机上的实时识别算法,通过缩短特征点检测时间和降低尺度空间特征点定位的复杂度,保证识别的实时性和准确性.实验结果表明,本算法能有效地运行在普通的资源受限智能手机上,具有较好的通用性;同时能实现对场景的实时识别,消耗内存资源也较少,适合在实际应用中使用. 相似文献

19.

复杂场景下的运动目标识别算法

宫法明李翛然马玉辉《计算机系统应用》2018,27(8):193-197

目标识别是计算机视觉的基本目的,同时也是人工智能领域的重要组成部分之一.随着信息化时代的来临,视频采集工具的普及,海量的视频数据给人工识别带来了巨大挑战.现阶段,在智能交通领域、生产质检领域等简单场景中,视频识别技术已经得到广泛的应用.如何从复杂场景中实现目标的识别和检测则成为了更加重要和困难的问题.针对该问题,本文提出了一种复杂场景下的运动目标识别算法.首先,提出一种改进的光流算法,通过时间序列以及空间像素变化对运动目标区域进行快速标记;其次,对目标区域进行滑动窗口检测,匹配人体各部位模型,并将反馈信息利用树形结构进行人体建模,实现在复杂场景下识别运动目标.通过实验进行评估,该方法能够在保证较高准确率的情况下,相比基于深度学习的检测算法检测速度更快,可以满足实时监测的要求. 相似文献

20.

光流分量分解的步态识别

罗正平刘延钧杨天奇《计算机科学》2016,43(9):295-300

步态识别因其远距离和难于伪装等特点在生物识别技术中颇受关注。针对目前特征提取方法信息量不足的现状,提出一种基于光流分量分解的步态识别方法,对步态光流图中横向分量和纵向分量为正的部分按行、列进行分解,求出每行和每列的光流横、纵向分量,得到4个特征向量。根据训练得出的每个特征向量在识别过程中的权重进行特征融合。将主成分分析和线性判别分析相结合,用动态时间规整算法进行匹配,最后采用最近邻分类算法分类。在CASIA Database B和C上的实验表明,该方法在正常、背包和穿大衣的条件下分别得到了97%,90%和64%的识别率,在慢速和快速行走的条件下分别得到了88%和87%的识别率。相似文献