共查询到20条相似文献,搜索用时 174 毫秒
1.
针对自然场景图像,本文提出一种融合空间上下文的场景语义建模和分类方法.针对场景中的局部语义对象,建立了基于贝叶斯网络的语义上下文模型.通过对已标注训练样本集的学习训练,获得局部语义对象在各类场景下的上下文模型.对于待分类的图像,首先利用支持向量机实现分割区域的分类,根据学习得到的语义上下文模型,提取图像中各语义对象的空间上下文信息,形成图像的语义上下文描述,实现场景分类.针对不同场景下的局部语义对象,利用贝叶斯网络自动学习得到不同的空间关系集合用于上下文信息提取,使得场景描述和分类过程更智能和有效.通过在六类自然场景图像数据集上的实验表明,本文所提算法能够很好的利用上下文信息,并取得满意的分类结果. 相似文献
2.
场景图像分割一直是机器视觉学习中较为复杂的重难点问题.本文在机器视觉注意力机制学习方法的基础上,融合人类对事物个体的认知,提出场景对象的Focus+Context语义表征,将对象类别信息带入图像底层特征学习中,运用概率统计理论,在抽象层上建模局部区域对象,再联合上下文语义信息推理全局与局部区域对象之间的关系,以实现类内焦点对象(Focus)突出的场景语义分割.实验验证,基于Focus+Context的语义表征和建模能够增加对象的识别率,尤其是在小样本环境下,所提出的方法能极大地简化场景的理解. 相似文献
3.
针对遥感图像场景分类的特点,提出了一种基于SURF和PLSA的分类方法。该方法首先采用SURF算法提取图像的局部特征,其次对特征利用K-means聚类生成视觉词汇表,从而得到图像的视觉词袋描述。然后利用概率潜在语义分析(PLSA)从图像中提取潜在语义特征,最后使用支持向量机(SVM)分类器完成图像的场景分类任务。在21类场景图像上的实验结果表明,文中方法可以有效提高遥感图像的场景分类精确度。 相似文献
4.
自然场景文本识别中采用固定大小的卷积核提取视觉特征,后仅进行字符分类的方法,其全局建模能力弱且忽视了文本语义建模的重要性,因此,本文提出一种基于字符注意力的自然场景文本识别方法。首先构建不同于卷积网络的多级efficient Swin Transformer提取特征,其可使不同窗口的特征进行信息交互;其次设计了字符注意力模块(character attention module, CAM),使网络专注于字符区域的特征,以提取识别度更高的视觉特征;并设计语义推理模块(semantic reasoning module, SRM),根据字符的上下文信息对文本序列进行建模,获得语义特征来纠正不易区分或模糊的字符;最后融合视觉和语义特征,分类得到字符识别结果。实验结果表明,在规则文本数据集IC13上识别准确率达到了95.2%,在不规则的弯曲文本数据集CUTE上达到了85.8%,通过消融及对比实验证明了本文提出的方法可行。 相似文献
5.
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能. 相似文献
6.
传统视觉词典模型没有考虑图像的多尺度和上下文语义共生关系.本文提出一种基于多尺度上下文语义信息的图像场景分类算法.首先,对图像进行多尺度分解,从多个尺度提取不同粒度的视觉信息;其次利用基于密度的自适应选择算法确定最优概率潜在语义分析模型主题数;然后,结合Markov随机场共同挖掘图像块的上下文语义共生信息,得到图像的多尺度直方图表示;最后结合支持向量机实现场景分类.实验结果表明,本文算法能有效利用图像的多尺度和上下文语义信息,提高视觉单词的语义准确性,从而改善场景分类性能. 相似文献
7.
8.
9.
基于多特征扩展pLSA模型的场景图像分类 总被引:2,自引:0,他引:2
场景图像分类近年来受到人们的广泛关注,而基于统计模型的方法更是场景分类中的研究热点。我们提出了一种新的基于多特征融合和扩展pLSA模型的场景图像分类框架。对每幅图像首先用多尺度规则分割确定局部基元,然后提取每个局部基元的多分辨率直方图矩特征和SIFT特征,最后用扩展的概率生成模型对图像集进行建模,测试。我们的方法不仅能够很好的表示图像的语义特性而且在模型的训练阶段是无监督的。我们针对目前常用的3个数据库,做了三组对比实验,均取得了比以前的方法更好的识别结果。 相似文献
10.
11.
针对专业领域复杂的检索需求,目前相关研究采用基于语义的方法来扩展检索范围并提高准确度.在语义推理方面,目前搜索引擎通常直接采用语义网中的推理算法,推理效率不高.在排序方面,基于关键字的搜索引擎的排序算法也不适合对语义检索结果进行排序.针对上述问题,本文给出了基于语义网的语义规则建立方法,并提出了一种基于闭合世界假设的反向链接推理算法,提高推理效率,同时给出了一种基于特征相似性排序算法,使检索结果排序方式更加符合语义检索的特点.基于本文提出的方法,构造了语义搜索引擎MaterialHub,实验表明该搜索引擎提高了检索的准确率和查全率,有较好的查询响应时间,并已经得到实际应用. 相似文献
12.
文中提出了基于树状结构的语义相似度计算方法.结合概念节点之间的语义关系、语义距离、概念节点的深度、密度对语义相似度的影响,利用树的层次关系来表达概念节点之间的语义信息,并对概念节点密度的计算进行改进,加入了可调节的参数,以适应不同的情景.通过实验验证了该算法在查准率方面具有较强的优越性. 相似文献
13.
14.
机器要完全智能化,自然语言理解是基础,其中语义是最突出的问题.语义分析方法的选择,对于处理各类不同的语料有着十分重要的作用.介绍语义分析理论,并重点分析语义网络、袼语法、概念从属理论和本体等语义分析方法;提出在选择语义知识表示方法时应遵循的原则;最后,分析基于语义的自然语言理解的重要性及发展趋势. 相似文献
15.
16.
传统的题库并未考虑到题目的语义及题目之间的关系.针对这个问题,介绍了语义网络和本体的概念,探讨了应用本体来构造题库中题目的有关知识,从而形成用知识型题库的方法和基于本体的语义搜索技术来分析题目所涵盖知识点的方法. 相似文献
17.
在实时监控系统的应用背景下,基于MPEG-7标准中层语义上,重点对监控视频图像时间空间关系判断和目标识别方法进行了全面的论述,并给出了一种在监控视频中判断多帧多目标之间时间关系和空间关系的算法,且为目标运动趋势估计提供了有力的支持。 相似文献
18.
解决语义鸿沟必须建立图像低层特征到高层语义的映射,针对此问题,本文提出了一种基于词汇树层次语义模型的图像检索方法.首先提取图像包含颜色信息的SIFT特征来构造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇.并在此基础上利用Bayesian决策理论实现视觉词汇到语义主题信息的映射,进而构造了一个层次语义模型,并在此模型基础上完成了基于内容的语义图像检索算法.通过检索过程中用户的相关反馈,不仅可以加入正反馈图像扩展图像查询库,同时能够修正高层语义映射.实验结果表明,基于该模型的图像检索算法性能稳定,并且随着反馈次数的增加,检索效果明显提升. 相似文献
19.
在分析传统语义相似度计算方法的基础上,综合考虑了边的深度、密度、强度及两个概念的语义重合度、层次差等主要影响因素,提出了一种基于语义树的概念相似度计算方法,并验证了该算法的合理性. 相似文献
20.
基于本体的信息检索技术能够提高在复杂环境中的信息检索效率,而语义相似度计算是基于本体的信息检索技术的关键技术。在医疗领域本体的基础上,通过分析讨论了概念间的语义相似度与相关度,并对概念间的语义相似度与相关度的影响因素进行研究,提出了一种计算医疗概念间的语义相似度及相关度的数值,并得到两者综合值的计算模型。实验结果表明,该模型能够提高相似度数值的有效性,并通过对相似度数值的计算体现出医疗领域概念间的复杂关系。 相似文献