排序方式: 共有66条查询结果,搜索用时 0 毫秒
41.
42.
43.
44.
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能. 相似文献
45.
46.
47.
音频信息检索的研究及实现 总被引:9,自引:0,他引:9
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。 相似文献
48.
视频摘要是视频内容的一种压缩表示方式。为了能够更好地浏览视频,提出了一种根据浏览或检索的粒度不同来建立两种层次视频摘要(镜头级和场景级)的思想,并给出了一种视频摘要生成方法:首先用一种根据内容变化自动提取镜头内关键帧的方法来实现关键帧的提取;继而用一种改进的时间自适应算法通过镜头的组合来得到场景;最后在场景级用最小生成树方法提取代表帧。由于关键帧和代表帧分别代表了它们所在镜头和场景的主要内容,因此它们的序列就构成了视频总结。一些电影视频片段检验的实验结果表明,这种生成方法能够较好地提供粗细两种粒度的视频内容总结。 相似文献
49.
随着多媒体技术的发展,许多领域产生大量的高维数据集。为了有效地检索这些高维数据,高维索引成为人们研究的热点。聚类树是一种有效地支持高维数据检索的索引结构。提出了一种基于子空间聚类的聚类树结构,该索引结构基于一种改进的CLIQUE聚类算法,利用小波变换的多尺度特性对图像特征分布曲线进行不同尺度的小波变换,去除一些小的分类和可能的噪声干扰,从而得到不同粒度下的层次聚类。在层次聚类的基础上,建立起分层索引结构。由于改进的聚类算法使用爬山法确定子空间聚类,因而有效地避免了用户参数的定义。实验结果证明,该方法在不需要用户设定聚类参数下能够进行有效聚类,在不同尺度下构建的聚类结构能够有效地组织图像关系,大大提高图像的检索效率。 相似文献
50.
本文在分析现有的镜头边界检测方法的基础上,提出了一种层次化镜头边界检测方法.首先我们利用小波变换对信号奇异点的检测能力和对噪声具有较强的鲁棒性,实现了镜头边界的预检测.然后我们通过对候选镜头边界的虚警分析,有效地降低了闪光灯和快速运动对镜头边界检测产生的影响,并实现了镜头突变检测.在渐变类型分类中,我们分别实现了淡入淡出、扫换和溶解等三种重要镜头边界类型的检测.实验结果表明,本文方法能够快速、有效地实现视频镜头边界类型的检测,对运动和光线变化有较强的鲁棒性. 相似文献