首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于支持向量机与细节层次的三维地形识别与检索   总被引:3,自引:1,他引:3  
提出对相似3D物体识别与检索的算法.该算法首先使用细节层次模型对3D物体进行三角面片数量的约减,然后提取3D物体的特征.由于所提取的特征维数很大,因此独立成分分析被用来进行3D特征约减.基于约减后的特征,使用支持向量机进行识别与检索.将该算法用于3D丘陵与山地的地形识别中,取得了良好效果。  相似文献   

2.
用颜色特征进行基于形状的检索   总被引:5,自引:1,他引:4  
现有的多媒体数据库系统中对图片的检索基本上是基于描述关键字的,近几年开始研究基于内容的检索。基于内容的图像检索技术大多采用颜色特征。对于以形状为主的图片来说,基于颜色的检索就没有任何意义。但对真彩色图像提取形状特征是比较困难,且大部分用形状特征来匹配图形的算法,对图形的旋转、伸缩等不具有鲁棒性。该文采用颜色特征来获取图像中物体的形状特征,并基于此进行图像形状匹配算法。同时通过对算法的改进,使图像的大小变化和旋转以及轻微的光照变化不影响检索结果。实验结果表明这种方法改善了检索效果。  相似文献   

3.
许源  薛向阳 《计算机科学》2006,33(11):134-138
准确提取视频高层语义特征,有助于更好地进行基于内容的视频检索。视频局部高层语义特征描述的是图像帧中的物体。考虑到物体本身以及物体所处的特定场景所具有的特点,我们提出一种将图像帧的局部信息和全局信息结合起来提取视频局部高层语义特征的算法。在TRECVID2005数据集上的实验结果表明,与单独基于局部或者单独基于全局的方法相比,此方法具有较好的性能。  相似文献   

4.
自动提取图像中的文本对图像视频检索具有重要意义.提出了一种基于颜色和笔画特征,应用无监督聚类方法进行复杂背景下的文本分割算法.首先在对文本行图像增强的基础上,应用颜色约减和直方图确定文本颜色.然后提取颜色和笔画特征,应用k-均值聚类算法分割出文本和背景像素.最后应用后处理优化分割结果.实验表明,该算法具有较好的分割效果.  相似文献   

5.
近年来,随着视频监控系统在自然保护区的大量部署,如何有效利用日益增加的海量视频监控数据成为亟待解决的难题.通过基于图像相似度的关键帧提取算法对海量视频数据进行清洗和压缩,同时利用基于深度学习的目标检测算法提取关键帧中的有效视频信息,并提供多种基于内容的视频检索方式,自动对用户提交的检索内容进行分析与处理,从而快速检索出感兴趣的视频.通过对青海湖野生动物视频监控数据进行分析与检索,验证了该系统的有效性.  相似文献   

6.
基于文字和图像信息提取视频关键帧   总被引:7,自引:0,他引:7  
关键帧提取是基于内容检索的一个重要的组成部分,所提取的关键帧的质量的好坏,直接影响检索的结果。该文介绍了目前几种较为典型的算法,并在对其进行分析比较的基础上,针对新闻视频提出了基于文字和图像信息提取关键帧的算法,取得了很好的效果,最后在结论中提出了综合运用音频、图像、文字和运动信息提取关键帧的层次化算法思想。  相似文献   

7.
台标分割与识别在视频语义分析与检索中有着重要作用.首先分析了视频图像序列中台标区域分割算法,然后分析了台标小波特征参数提取方法,并利用提取的小波特征参数实现了台标识别.实验表明,基于小波特征参数的台标识别算法取得了较快的识别速度和较高的识别准确率.  相似文献   

8.
基于语义概念的视频检索系统的设计与实现   总被引:2,自引:0,他引:2       下载免费PDF全文
设计并实现了一种基于语义概念的视频检索系统,该系统包括视频镜头分割与关键帧提取、语义概念检测和用户检索3个部分。系统采用镜头分割与关键帧提取对视频进行层次分割,并对关键帧图像提取有效的图像低层特征,再使用支持向量机(SVM)进行概念的检测,最后针对概念内容进行视频检索。在概念检测中,提出了一种基于验证平均准确率的线性加权方法对SVM的分类结果进行后融合。实验结果表明,该方法可以达到较高的检索准确率。  相似文献   

9.
针对月面巡视探测器自主导航中的障碍识别问题,为了采集清晰有效的图形,使用一种基于图像增强的方法结合尺度不变的特征点提取和匹配新的算法来识别障碍物。使用图像增强方法预处理图像,用多尺度特征极值点检测的SIFT方法,提取特征,进行左右双目图像的特征匹配。与传统视觉算法相比,可以解决仿真试验场较差的光源环境,并提高对不同光照环境图像的特征提取和匹配的鲁棒性。在仿真试验场的双目视觉图像匹配中,仿真实验取得较好的效果。  相似文献   

10.
MPEG-7颜色、纹理和形状描述子   总被引:3,自引:1,他引:3  
MPEG-7视觉标准制定了若干基于图像内容的视觉描述子,从而为直观地表达图像和视频特征提供了更加行之有效的方法。在对图像或视频进行基于内容的识别、过滤和浏览时,视觉描述子有着广泛的应用。MPEG-7定义了颜色、纹理、(物体)形状、运动等视觉描述子,论文介绍其中颜色、纹理和形状描述子的意义、提取算法以及一些主要的特性。  相似文献   

11.
Because of the media digitization, a large amount of information such as speech, audio and video data is produced everyday. In order to retrieve data from these databases quickly and precisely, multimedia technologies for structuring and retrieving of speech, audio and video data are strongly required. In this paper, we overview the multimedia technologies such as structuring and retrieval of speech, audio and video data, speaker indexing, audio summarization and cross media retrieval existing today for TV news detabase. The main purpose of structuring is to produce tables of contents and indices from audio and video data automatically. In order to make these technologies feasible, first, processing units such as words on audio data and shots on video data are extracted. On a second step, they are meaningfully integrated into topics. Furthermore, the units extracted from different types of media are integrated for higher functions. Yasuo Ariki, Ph.D.: He is a Professor in the Department of Electronics and Informatics at the Ryukoku University. He received his B.E., M.E. and Ph.D. in information science from Kyoto University in 1974, 1976 and 1979, respectively. He had been an Assistant in Kyoto University from 1980 to 1990, and stayed at Edinburgh University as visiting academic from 1987 to 1990. His research interests are in speech and image recognition and in information retrieval and database. He is a member of IPSJ, IEICE, ASJ, Soc. Artif. Intel. and IEEE.  相似文献   

12.
基于内容的新闻视频检索技术研究   总被引:2,自引:0,他引:2  
新闻视频的检索具有较大的实用意义。本文结合新闻视频的层次结构,从具体的每一步骤对现有的基于内容的新闻视频检索的常用技术,尤其是关于利用音视特征来进行新闻单元分割,进行了总结和探讨比较,指出了目前研究中存在的主要问题并提出了今后的研究方向。  相似文献   

13.
In this paper, we derive new geometric invariants for structured 3D points and lines from single image under projective transform, and we propose a novel model-based 3D object recognition algorithm using them. Based on the matrix representation of the transformation between space features (points and lines) and the corresponding projected image features, new geometric invariants are derived via the determinant ratio technique. First, an invariant for six points on two adjacent planes is derived, which is shown to be equivalent to Zhu's result [1], but in simpler formulation. Then, two new geometric invariants for structured lines are investigated: one for five lines on two adjacent planes and the other for six lines on four planes. By using the derived invariants, a novel 3D object recognition algorithm is developed, in which a hashing technique with thresholds and multiple invariants for a model are employed to overcome the over-invariant and false alarm problems. Simulation results on real images show that the derived invariants remain stable even in a noisy environment, and the proposed 3D object recognition algorithm is quite robust and accurate.  相似文献   

14.
15.
综合利用声视特征的新闻视频结构化模型   总被引:5,自引:1,他引:5  
视频结构化表征和基于这种表征进行相似度比较是视频检索的前提和最基础的重要工作。该文受视频制作过程的启发,通过分析新闻视频的内容结构特点,提出一个基于多语义抽象层次表示的5层视频目录结构化模型;在此基础上,采用分层处理思想,通过综合利用声视特征实现了基于目录结构的新闻视频结构化,克服了单纯用视觉特征难以胜任场景分段的困难,实验验证了该文思想及相应算法的有效性。  相似文献   

16.
17.
一种基于内容相关性的跨媒体检索方法   总被引:12,自引:0,他引:12  
针对传统基于内容的多媒体检索对单一模态的限制,提出一种新的跨媒体检索方法.分析了不同模态的内容特征之间在统计意义上的典型相关性,并通过子空间映射解决了特征向量的异构性问题,同时结合相关反馈中的先验知识,修正不同模态多媒体数据集在子空间中的拓扑结构,实现跨媒体相关性的准确度量.实验以图像和音频数据为例验证了基于相关性学习的跨媒体检索方法的有效性.  相似文献   

18.
人脸特征点自动定位及对应点匹配是计算机视觉和模式识别领域一个非常热门的研究方向,应用领域包括图像配准、对象识别与跟踪、3维重建、立体匹配等。通过相对角直方图分布和K均值聚类确定脸部特征点的聚类点集,再利用几何信息提取聚类点集的特征,进而采用支持向量机分类最终从点集中分离出39个脸部特征点。实验结果表明,此混合提取方法比单纯使用RAC得到了更好的匹配准确率,在给定的距离阈值范围内,50%的特征点定位准确率达到了100%。  相似文献   

19.
This paper presents a tunable content-based music retrieval (CBMR) system suitable the for retrieval of music audio clips. The audio clips are represented as extracted feature vectors. The CBMR system is expert-tunable by altering the feature space. The feature space is tuned according to the expert-specified similarity criteria expressed in terms of clusters of similar audio clips. The main goal of tuning the feature space is to improve retrieval performance, since some features may have more impact on perceived similarity than others. The tuning process utilizes our genetic algorithm. The R-tree index for efficient retrieval of audio clips is based on the clustering of feature vectors. For each cluster a minimal bounding rectangle (MBR) is formed, thus providing objects for indexing. Inserting new nodes into the R-tree is efficiently performed because of the chosen Quadratic Split algorithm. Our CBMR system implements the point query and the n-nearest neighbors query with the O(logn) time complexity. Different objective functions based on cluster similarity and dissimilarity measures are used for the genetic algorithm. We have found that all of them have similar impact on the retrieval performance in terms of precision and recall. The paper includes experimental results in measuring retrieval performance, reporting significant improvement over the untuned feature space.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号