共查询到20条相似文献,搜索用时 15 毫秒
1.
Human Action Recognition in Videos Using Kinematic Features and Multiple Instance Learning 总被引:1,自引:0,他引:1
Ali Saad Shah Mubarak 《IEEE transactions on pattern analysis and machine intelligence》2010,32(2):288-303
We propose a set of kinematic features that are derived from the optical flow for human action recognition in videos. The set of kinematic features includes divergence, vorticity, symmetric and antisymmetric flow fields, second and third principal invariants of flow gradient and rate of strain tensor, and third principal invariant of rate of rotation tensor. Each kinematic feature, when computed from the optical flow of a sequence of images, gives rise to a spatiotemporal pattern. It is then assumed that the representative dynamics of the optical flow are captured by these spatiotemporal patterns in the form of dominant kinematic trends or kinematic modes. These kinematic modes are computed by performing Principal Component Analysis (PCA) on the spatiotemporal volumes of the kinematic features. For classification, we propose the use of multiple instance learning (MIL) in which each action video is represented by a bag of kinematic modes. Each video is then embedded into a kinematic-mode-based feature space and the coordinates of the video in that space are used for classification using the nearest neighbor algorithm. The qualitative and quantitative results are reported on the benchmark data sets. 相似文献
2.
提出了一种基于多视频的虚实融合可视化系统的构建方法,旨在将真实世界中的图像和视频融合到虚拟场景中,用视频图像中的纹理和动态信息去丰富虚拟场景,提高虚拟环境的真实性,得到一种增强的虚拟环境.利用无人机采集图像来重建虚拟场景,并借助图像特征点的匹配来实现视频图像的注册.然后利用投影纹理映射技术,将图像投影到虚拟场景中.视频中的动态物体由于在虚拟环境中缺失对应的三维模型,直接投影,当视点发生变化时会产生畸变.首先检测和追踪这些物体,然后尝试使用多种显示方式来解决畸变问题.此外,系统还考虑有重叠区域的多视频之间的融合.实验结果表明,所构造的虚实融合环境是十分有益的. 相似文献
3.
4.
The utilization of hyperspectral remote sensing image is mainly based on the spectral information,and the spatial information is always be ignored.To solve this problem,a novel hyperspectral multiple features optimization approach based on improved firefly algorithm is presented.Firstly,four spatial features,the local statistical features,gray level co-occurrence matrix features,Gabor filtering features and morphological features of hyperspectral remote sensing image are extracted,and some spectral bands are selected and then combined with these spatial features,and the feature set is constructed.Then,the firefly algorithm is used to optimize the extracted features.In view of the slow convergence speed of firefly algorithm,we use the random inertia weight from particle swarm optimization algorithm to modifiy the location update formula of firefly algorithm,and JM(Jeffreys-Matusita)distance and Fisher Ratio are used as the objective function.Two urban hyperspectral datasets are used for performance evaluation,and the classification results derived from spectral information and spectral-spatial information are compared.The experiments show that random inertia weight can improve the speed of FA-based feature selection algorithm,the performance with multiple features is better than that of spectral information for urban land cover classification,The statistical results of the two sets of experimental data indicate that the selected number of morphological features are the most in the four spatial features.The local statistical features and morphological features are more helpful to the classification of hyperspectral remote sensing images than GLCM and Gabor features. 相似文献
5.
为了提高搜索引擎查询结果的质量,越来越关注于对用户提交的网络查询意图的识别。基于查询session对用户提交的查询进行多维度特征提取,尽量能全面系统地描述查询分类特征,并使用SVM进行分类。实验结果表明通过结合查询的多个特征有助于识别查询意图,在人工标注的测试集中对查询意图分类的正确率达到80%。 相似文献
6.
7.
8.
The access patterns of most information systems follow the 80/20 rules. That is, 80% of the requests are for 20% of the data. A video server can take advantage of this property by waiting for requests and serving them together in one multicast. This simple strategy, however, incurs service delay. We address this drawback in this paper by allowing clients to receive the leading portion of a video on demand, and the rest of the video from an ongoing multicast. Since clients do not have to wait for the next multicast, the service latency is essentially zero. Furthermore, since most services require the server to deliver only a small leading portion of the video, the server can serve many more clients per time unit. We analyze the performance of this approach, and determine the optimal condition for when to use this strategy. We compare its performance to a hardware solution called Piggybacking. The results indicate that more than 200% improvement is achievable. 相似文献
9.
图像特征的提取与表达是基于内容的图像检索技术基础。边缘是重要的视觉感知信息,也是图像最基本的特征之一,其在图像分析和理解中有重要价值。文中以视觉重要的图像边缘轮廓为基础,提出一种基于彩色边缘综合特征的图像检索算法。该算法首先利用Canny检测算子提取出原始图像的彩色边缘轮廓。然后构造出能全面反映边缘轮廓内容的3种直方图,即加权颜色直方图、角度直方图和梯度方向直方图。最后综合利用上述3种彩色边缘直方图计算图像间的内容相似度,并进行彩色图像检索。仿真实验表明,该算法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率。 相似文献
10.
为了提高彩色图像检索的准确性,以回归型支持向量机(SVR)理论为基础,结合重要的图像边缘信息,提出了一种鲁棒的多特征彩色图像检索新方法。该方法首先利用回归型支持向量机(SVR)理论,对原始图像进行去噪处理及彩色边缘提取;然后将整个彩色边缘划分成局部网格区域,并分别计算出每个网格区域的颜色直方图和纹理直方图;最后综合利用上述网格区域的颜色直方图和纹理直方图来计算图像间内容的相似度,并进行彩色图像检索。实验结果表明,该方法不仅能够准确、快速的检索出用户所需图像,而且对光照、锐化、模糊等噪声攻击均具有较好的鲁棒性。 相似文献
11.
Adaptive Visual Servoing Using Point and Line Features With an Uncalibrated Eye-in-Hand Camera 总被引:1,自引:0,他引:1
《Robotics, IEEE Transactions on》2008,24(4):843-857
12.
显著性检测是近年来国内外计算机视觉领域研究的热点问题,在图像压缩、目标识别与跟踪、场景分类等领域具有广泛的应用.针对大多显著性检测方法只针对单个目标且鲁棒性不强这一问题,本文提出一种基于深度特征的显著性检测方法.首先,在多个尺度上对输入图像进行超像素分割,利用目标先验知识对预显著区域进行提取和优化.然后,采用卷积神经网络提取预选目标区域的深度特征.对高维深度特征进行主成分分析并计算显著性值.最后,提出一种改进的加权多层元胞自动机方法,对多尺度分割显著图进行融合优化,得到最终显著图.在公开标准数据集SED2和HKU_IS的实验表明,与现有经典显著性检测方法相比,本文方法对多显著目标检测更准确. 相似文献
13.
该文提出了一种新的识别有遮挡目标的方法,即将目标模型和含有目标的遮挡图象的轮廊在某一尺度上张角的极值、极值点(亦称显著点)之间距离、相对位置等信息集成在一起,作为描述目标模型(遮挡图象)的一组特征,且这组特征在平移、旋转和均匀尺度变换下保持不变。其轮廓上点p处的张角可用余弦定理很方便地求出,而张角的极值点则对应于轮廊急剧变化的地方。同时将特征匹配定义为模型特征与遮挡图象特征之间的对应,若这种对应被映射到Hopfield神经网络上,则该网络即可用于完成全局特征匹配。该文提出了的方法已在PⅡ个人计算机上用Matlab5.2编程实现,并给出了应用实例。实验结果表明,该方法能有效地从含有遮挡目标的景物图象中识别出目标,且实现起来非常方便。 相似文献
14.
基于动态贝叶斯网络的音视频双模态说话人识别 总被引:4,自引:2,他引:4
动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行音视频说话人识别的实验.通过对不同层级的建模过程及说话人识别实验的结果进行分析,结果表明,动态贝叶斯网络为描述音视频间的时序相关性和特征相关性提供了有效的建模方法,在不同语音信噪比的情况下均能提高说话人识别的性能. 相似文献
15.
16.
多特征组合和图切割支持的物体/背景分割方法 总被引:4,自引:0,他引:4
运动物体分割是计算机视觉应用领域中的一个基本问题,阴影和亮度变化均易造成分割结果错误.通过组合多种图像特征,实现了一种新的检测运动物体方法.一方面,组合图像的颜色、梯度和纹理特征,利用梯度和纹理信息时亮度变化不敏感的特性,提高运动物体分割的准确性;另一方面,使用图切割算法对物体/背景进行分割,在不影响整体分割结果前提下修正局部判别错误的像素点,分割结果噪声少且稳定性强.对不同场景的分割结果表明,该方法是高效的和实用的. 相似文献
17.
结合多种特征的高分辨率遥感影像阴影检测 总被引:2,自引:0,他引:2
针对现有的阴影检测算法对较亮阴影和较暗地物中的阴影不能同时较好地检测等问题, 提出一种结合多种特征的高分辨率遥感影像阴影检测方法.该算法首先结合主成分分析、颜色特征和直方图的分割构建多种阈值检测条件, 然后综合多种特征来进行遥感影像阴影的初步检测, 最后通过分析RGB模型在阴影与非阴影地物上的差别, 利用颜色特性最终检测出阴影区域.实验结果表明, 本文算法能有效检测较亮阴影和较暗地物中的阴影.与现有方法相比, 较亮阴影的平均总错误率从水平集法的31.85%降至24.61%, 较暗地物中阴影的平均总错误率从自动检测法的37.75%降至23.30%. 相似文献
18.
刘艳丽 《计算机与数字工程》2008,36(4):125-126
利用模板能更加快速地创建影片,以Macromedia Captivate为例,介绍模板的设计、制作及使用方法.能节省时间,统一风格,极大地提高工作效率. 相似文献
19.
手写输入法有显著优点,但目前手写输入法普遍依赖于"手写板"这种特殊设备.改进了目前手写输入法设计思路,利用摄像头拍摄书写的过程,生成手写字体图像,为识别成文字做准备.该输入法特点就是不用"手写板",而充分利用了日益普及的摄像头.实验表明,该方法有较强的可行性和可用性. 相似文献
20.
监控系统中的多摄像机协同 总被引:8,自引:0,他引:8
描述了一个用于室内场合对多个目标进行跟踪的分布式监控系统.该系统由多个廉价的固定镜头的摄像机构成,具有多个摄像机处理模块和一个中央模块用于协调摄像机间的跟踪任务.由于每个运动目标有可能被多个摄像机同时跟踪,因此如何选择最合适的摄像机对某一目标跟踪,特别是在系统资源紧张时,成为一个问题.提出的新算法能根据目标与摄像机之间的距离并考虑到遮挡的情况,把目标分配给相应的摄像机,因此在遮挡出现时,系统能把遮挡的目标分配给能看见目标并距离最近的那个摄像机.实验表明该系统能协调好多个摄像机进行目标跟踪,并处理好遮挡问题. 相似文献