首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
传统的信息检索方法一般都采用对文本内容的词频进行分析的统计方法,这种索引方法仅仅考虑词语在文本中的出现率,因此不能抽取出表达文本语义的索引词。为了解决这个问题,本文提出了一种新的信息检索方法,即基于概念的权重索引方法。本方法引入了概念类的概念,并且提出了用概念之间存在的关系来表示文档中的词汇和概念的语义重要度。本方法比单纯的词汇信息更能体现文本的概念特征,提高信息检索的性能;同时还能降低文本向量的维数,减少计算量,提高检索效率。  相似文献   

2.
传统的基于关键词和关键词向量空间的检索模型在查全率和查准率上效率较低,在临床领域本体的基础上,通过分析和讨论了改进的概念间语义相似度和相关度混合计算方法,提出基于临床领域本体的语义信息检索模型。实验结果表明,该混合计算方法是可行性的,能有效提高语义信息检索模型的查准率。  相似文献   

3.
针对用户评论文本情感分类过程中缺乏特征词语义分析和数据维度过高的问题,提出了一种基于语义分析的在线评论情感分类方法。利用Word2Vec工具获得词向量,通过词向量运算获取评论文本中的词与情感词典中的词之间的语义相似度,然后根据此相似度的大小选择反映正面或负面情感的词作为评论文本的关键特征。通过非负矩阵分解算法,将原始评论文本映射到一个低维的语义空间,降低评论数据维度,增强评论文本之间的语义相关度。实验表明,提出的算法具有更好的文本情感分类能力。  相似文献   

4.
文本相似度计算在专利信息分析系统中有着广泛的应用前景.传统的基于向量空间模型的文本相似度计算方法,一方面未能很好地考虑上下文信息对词语语义的约束,导致不能对不同语境中词语的语义进行有效区分;另一方面使用词典作为计算相似度的依据具有领域相关性,在特定领域未能给出有效的语义理解.提出一种使用领域本体作为文本相似度计算基础的方法,该方法中使用语义消歧来解决上下文对于词语语义的影响;使用领域本体概念意义相同关系来计算文本相似度.实验结果显示本方法的准确度相对于现有典型的相似度计算方法有所提高.  相似文献   

5.
针对如何根据用户的检索状况来提高信息检索的反应速度及查询的准确性的问题,利用向量空间模型信息检索与路径相似度蚁群算法中利用同一方式——相似度来决定下一步方向的共同特点,提出将一种基于路径相似度的蚁群算法应用于信息检索的方法。采用这种算法在性能和收敛性速度上优于常规算法。  相似文献   

6.
针对向量空间模型忽略词语出现位置和词序的缺点,结合科技文献结构明显分层的特点,本文提出了基于N层向量空间模型的文本相似度计算方法.该算法首先用N层向量空间模型表示查询短语和科技文献,其次在词频角度上和词序角度上分别计算两者间的相似度,最后得出整体的文本相似度.将本文算法应用于中、朝、英对照科技文献多语种检索模块测试其有效性,测试结果表明,本文设计的文本相似度计算方法算法性能较好,与传统的向量空间模型余弦相似度算法相比,查准率提高了2.7%,MRR提高了2.02%.  相似文献   

7.
将语义相似度计算模型定义为域、概念、属性组成的三维空间模型,并结合领域本体集,从概念格理论的角度考虑了该模型对语义相似度计算的影响.该模型通过对不同的向量加不同的权值来调节其对语义相似度计算的贡献,使计算结果达到最优,从而提高语义相似度计算的准确度.实验结果表明,与单方面计算相似度的方法相比,该方法能有效地提高语义相似度计算的查全率和查准率.  相似文献   

8.
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段.  相似文献   

9.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

10.
语义分析是将自然语言转换成为计算机可处理的谓词逻辑形式.由于谓词公式中仅包含客体和谓词两部分,不能完整、精确地表达自然语言语句的语义,限制了语义分析技术的广泛应用,因此需要对谓词进行改进.根据“符号学三角形”语义理论,自然语言和谓词逻辑作为符号系统,反映的都是现实世界在头脑中形成的概念.以认知概念为指导扩展谓词逻辑,增加谓词修饰元素和复杂客体,以提高谓词公式的表达能力.同时规范汉语词类、语法成分和句子结构到谓词公式组成元素间的对应关系和转换方法,保证谓词公式正确表达语句的语义.利用包含各种词类和短语作语法成分的汉语语句实例进行验证和分析,结果表明,对谓词的扩展和转换过程的规范,提高了谓词公式对汉语语句语义表达的完整和准确性,为更广泛深入地语义分析奠定了基础.  相似文献   

11.
介绍基于电力公司的多格式文档智能信息搜索系统的设计原理和实现过程。通过PHP调用COM组件以及Java调用jar包,将其他多种文档转换为".txt"文档,经过分词并采用基于句子特征的文本摘要生成方法生成".txt"文档的摘要。检索模块采用基于词索引的全文检索,信息检索模型采用空间向量模型,实现摘要及高相关度句子的输出。  相似文献   

12.
提出了基于语义和语法的服务检索方法. 采用语义相似度的方法对服务进行管理,以达到提高检索效率的目的;采用语法结构的方式,利用命题库模式对服务建模并提出检索算法,以提高服务检索的精确率. 以响应时间、召回率、精确率、综合评价指标为衡量指标,通过实验说明了结合语义和语法的检索方法的有效性.  相似文献   

13.
针对Web信息检索的特点,通过分析传统向量空间模型在Web检索中存在的若干问题,对传统向量空间模型进行改进,并提出结构化向量空间模型,其基本思想是将Web文档表达为具有一定逻辑结构的向量,即结构化向量组.每个结构化向量组由若干子向量构成,每个子向量对应Web文档中相对应独立的文本段.理论分析和实验证明,该方法能提高向量空间模型在信息检索精度和召回率方面的性能.  相似文献   

14.
传统的语义信息检索是基于检索词语义的匹配,无法满足检索不确定的、不完整的信息以及对检索结果进行聚类处理,因此,提出将模糊本体引入语义信息检索方法。该方法以本体技术先建立领域语义模型,各概念的隶属度加到语义建模的过程中,并提供语义标注;以模糊推理方式对概念、公理等本体进一步处理,从而便于计算机计算处理。能够提高在语义信息检索中对模糊信息进行检索的查准率、查全率,采用聚类技术对检索结果进行聚类,以达到智能化检索的目的。  相似文献   

15.
传统的基于关键词的信息检索不能理解用户的需要,仅仅对关键词进行简单的匹配,其结果往往包含大量与用户实际需要毫不相干的信息,同时却丢失用户实际需要的信息,使得检索的效率很低.基于本体的语义检索技术的出现,弥补了基于关键词检索的不足,成为目前构建信息检索系统的应用热点.本文主要针对燃气管网的材料腐蚀信息,设计一个基于GIS(Geography Information System)的管网材料腐蚀信息语义检索系统,使用户检索管网空间数据和腐蚀数据时为其提供相关数据的语义信息,同时也使得检索结果更加符合用户需求.  相似文献   

16.
基于本体语义的简单向量距离分类方法   总被引:1,自引:0,他引:1  
针对传统简单距离分类方法的特征选择未考虑到不同抽象层次上的词汇语义差异,提出了一种基于本体语义的简单向量距离分类方法,在本体库的支持下有效地将语言学知识融合到文本向量空间的表示中,进一步挖掘出特征项概念间的深层语义联系,用得到的语义特征向量作为最终的文本特征向量.同时定义了基于领域本体计算不同抽象层上的语义相似度,并将其应用到简单向量距离分类算法中.在数据集CWT20G上的实验表明:基于本体语义的简单距离分类算法对同义词、多义词、上下位词区分能力更强;并且分类准确率随着语义分析的深入逐步提高.  相似文献   

17.
在基于内容的图像检索方法中,图像的低级视觉特征和高级语义之间存在着较大的差异,导致检索性能不佳.为了提高检索性能,将相关反馈技术引入图像检索.利用支持向量机在相关反馈的过程中为图像建立语义模型,在建立语义信息后求出图像间的二次距离,增加图像间的语义区分能力,使被检索出的图像在语义上更加接近示例图像.试验表明,该方法使查全率和查准率得到较大提高.  相似文献   

18.
通过使用中药图像的语义模型、图像语义的提取和描述方法,分析了中药图像检索研究中存在的问题及一些现有的解决方法.针对中药图像进行了语义分类和语义检索,并且对基于语义的中药图像检索系统的设计和实现进行了研究.  相似文献   

19.
为了解决传统信息检索系统中存在的不足,以教务信息检索为例,提出了基于本体的语义信息检索系统的3层模型框架。在模型框架基础上,利用Protégé工具创建了教务知识本体,作为系统的数据源,利用Jena工具和Sparql语言实现了语义信息推理和检索,利用XML和XSL技术实现了用户界面显示,形成了一个完整的语义教务信息检索系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号