共查询到19条相似文献,搜索用时 125 毫秒
1.
2.
3.
4.
隐含语义索引及其在中文文本处理中的应用研究 总被引:33,自引:0,他引:33
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。 相似文献
5.
6.
基于潜在语义分析的个性化查询扩展模型 总被引:1,自引:1,他引:0
为在信息检索系统中获得更好的查询效果,提出一种混合的个性化查询扩展模型。通过潜在语义分析建立潜在语义空间,并在潜在语义空间中计算得到查询的概念相关扩展词和兴趣相关扩展词,不但有效解决了词典问题,而且满足了不同用户需求多样性和用户多兴趣点的需求。实验表明,该算法能够较好地提高搜索引擎系统的查全率、查准率,以及信息检索效率。 相似文献
7.
基于概念检索的中文搜索引擎的设计与实现 总被引:4,自引:0,他引:4
构建语义库和扩展查询是影响概念检索效率的主要因素。提出一种自动构建语义库和相关性查询扩展的方法,方法利用关联规则挖掘技术,自动从文档中导出概念/词语之间相关性及层次关系,构建关联库,再通过关联库,对查询请求进行相关性扩展,以实现概念检索。实验结果显示,方法是有效的,能提高信息检索的查全率和查准率。 相似文献
8.
9.
10.
语义检索关键技术研究 总被引:1,自引:1,他引:0
传统的基于关键字的信息检索,由于忽视了关键词本身所含的语义信息,故只能得到较低的查全率和查准率.而源于知识工程和人工智能领域的本体理论和技术,能够很好地处理自然语言理解问题和具有基于语义的推理机制,因此成为改进传统信息检索方式的良好工具.与传统的检索技术相比,它能提高检索的精度和覆盖率,减少了不相关的返回结果.文中将对语义检索系统中所涉及到的语义检索预处理及查询语义扩展等关键技术进行分析研究,为语义检索系统的顺利实施莫定了良好的理论与实践基础. 相似文献
11.
查询扩展技术是在原有用户查询的基础上加入语义相关的新词,组成语义更准确的查询条件。文中对查询扩展算法中扩展词加权方法进行改进,提出一种基于初始用户查询意欲和词与词间语义关联性给扩展词加权的方法。根据此算法得到的扩展词权值不仅反映了该扩展词和原关键词间的关联性,还反映出该扩展词和查询关键词集合中所有元素的关联性。因此,可将基于语义树的查询扩展问题转换为扩展词权值wijs,o,p的计算,如何计算出权值wijs,o,p是文中的核心。实验证明,该算法提高了检索的查准率。 相似文献
12.
该文提出基于Word Embedding的歧义词多个义项语义表示方法,实现基于知识库的无监督字母缩略术语消歧。方法分两步聚类,首先采用显著相似聚类获得高置信度类簇,构造带有语义标签的文档集作为训练数据。利用该数据训练多份Word Embedding模型,以余弦相似度均值表示两个词之间的语义关系。在第二步聚类时,提出使用特征词扩展和语义线性加权来提高歧义分辨能力,提高消歧性能。该方法根据语义相似度扩展待消歧文档的特征词集合,挖掘聚类文档中缺失的语义信息,并使用语义相似度对特征词权重进行线性加权。针对25个多义缩略术语的消歧实验显示,特征词扩展使系统F值提高约4%,使用语义线性加权后F值再提高约2%,达到89.40%。 相似文献
13.
知识管理中的联想检索 总被引:13,自引:0,他引:13
提供高效便捷的知识检索途径是知识管理系统走向实用化的关键,但传统的检索方法会遗漏大量有用信息而不适用于知识管理系统。文中根据语义网络中概念之间的语义关系把概念分解成核心网络和同义网络,并构造了一个检索扩展模板,以实现对查询语句的语义扩展,最后构造了一个权值计算函数对检索结果进行排序。 相似文献
14.
15.
中文文本的信息自动抽取和相似检索机制 总被引:1,自引:0,他引:1
目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求. 相似文献
16.
针对基于内容的图像检索系统检索效率不高的情况,从目标图像外轮廓特征的提取、图像外轮廓特征的描述方式、图像轮廓的语义描述方式和相似度测定4个方面对基于内容的图像检索的研究状况进行了分析和研究。综合图像的外轮廓特征及轮廓的语义描述来实现对图像数据库的检索。实验结果表明,该方法提高了图像检索的精度和效度。 相似文献
17.
在英语及其它的欧洲语言里,词汇语意关系已有相当充分的研究。例如,欧语词网( EuroWordNet ,Vossen 1998) 就是一个以语意关系来勾勒词汇词义的数据库。也就是说,词汇意义的掌握是透与其它词汇语意的关连来获致的。为了确保数据库建立的品质与一致性,欧语词网计画就每一个处理的语言其词汇间的词义关系是否成立提出相应的语言测试。实际经验显示,利用这些语言测试,人们可以更容易且更一致地辨识是否一对词义之间确实具有某种词义关系。而且,每一个使用数据库的人也可以据以检验其中关系连结的正确性。换句话说,对一个可检验且独立于语言的词汇语意学理论而言,这些测试提供了一个基石。本文中,我们探究为中文词义关系建立中文语言测试的可能性。尝试为一些重要的语意关系提供测试的句式和规则来评估其可行性。这项研究除了建构中文词汇语意学的理论基础,也对Miller的词汇网络架构(WordNet ,Fellbaum 1998) 提供了一个有力的支持,这个架构在词汇表征和语言本体架构研究上开拓了关系为本的进路。 相似文献
18.
A knowledge-based system is used as a front-end to a very large database to increase the relevance of the information being retrieved. The subject domain of the data base is modelled in a semantic network and the queries to the database are expanded according to the semantic model. An experiment has been performed on a bibliographic database, by developing the prototype KNOWIT, a knowledge-based front-end to the information retrieval system ESA-QUEST1. An experimental evaluation shows that the number of relevant bibliographic references retrieved with the knowledge-based front-end is significantly improved, without compromising the precision of the retrieval. 相似文献
19.
查询扩展是在原查询词的基础上加入与用户查询词相关的词或者词组,组成新的、更准确的查询序列,使扩展后的查询序列能更清晰地表达用户的查询请求,克服自然语言的“二义性”。基于《计算机网络》概念语义网络能更加有效地找出计算机网络领域内查询词的概念词及扩展概念词,并向上拓展将各个查询词的原始语义关系联接起来,解决了查询词之间缺乏联系的问题,为扩展检索的实现奠定基础。描述了概念语义网络的生成方法、关联概念树的抽取方法和查询扩展检索的计算机实现流程,为教学资源领域的在线学习提供了技术支持。 相似文献