首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
信息检索是与数据库系统并行发展了很多年的一个领域,它主要研究大量文本的信息组织和检索。典型的信息检索问题是基于用户的输入来定位相关的文本。而文本的相关性是一个模糊的概念,为了对这个模糊的概念以客观的度量,提出了一种新的文本间相关性的计算方法,该方法利用词频矩阵和模糊相似矩阵,在基于相关性检索的一组文档中,使用模糊聚类中的最大树算法,计算出一组文档间的相关度,最后用一个实例加以说明,得到了比较客观的结果。  相似文献   

2.
本文集中介绍了如何从文本数据中获取信息。典型的文本查询问题是基于用户的输入来定位相关的文本,而文本的相关性是个模糊的概念。为了对这个模糊的概念以客观的度量,我们通过模糊聚类分析,计算出文本间的相关度。最后用一个实例加以说明,得到了比较客观的结果。  相似文献   

3.
周瑛  张铃 《微机发展》2007,17(1):111-113
评价一个信息检索系统的标准是该系统在多大程度上满足用户的能力。文中从传统的评价信息检索系统的两大标准———计算查全率和查准率的公式出发,结合实际情况,考虑检索结果相关性是一个模糊的概念,为了对这个模糊的概念以客观的度量,应用模糊集的方法对传统的查全率和查准率的公式进行了两种修改。一种修改是在每篇文档对总的查全率和查准率的影响相同时进行的,而第二种修改则是在每一类文档对总的查全率和查准率的影响相同时进行的。这两种修改是对传统的基于二值相关性的检索评价系统的有效扩充。  相似文献   

4.
模糊集方法在检索评价系统中的应用   总被引:1,自引:0,他引:1  
评价一个信息检索系统的标准是该系统在多大程度上满足用户的能力。文中从传统的评价信息检索系统的两大标准——计算查全率和查准率的公式出发,结合实际情况,考虑检索结果相关性是一个模糊的概念,为了对这个模糊的概念以客观的度量,应用模糊集的方法对传统的查全率和查准率的公式进行了两种修改。一种修改是在每篇文档对总的查全率和查准率的影响相同时进行的,而第二种修改则是在每一类文档对总的查全率和查准率的影响相同时进行的。这两种修改是对传统的基于二值相关性的检索评价系统的有效扩充。  相似文献   

5.
关于提高文献的检索效率,在科技文献检索过程中,传统的基于关键词匹配的检索方法缺乏对知识的理解和处理,只能检索出包含关键词的文献,而不能检索出与关键词语义相似的文献,因而检索结果在查全率和查准率都无法满足检索者的要求.将模糊粗糙集理论引入信息检索当中,对信息检索模型的缺陷进行了改进.首先用传统的互信息函数计算标引词之间的语义关联权重,构建出模糊近似空间;然后用TF - IDF方法获得文档的模糊向量表示,在计算标引词重要度权重时,不但考虑了标引词出现的频度,还考虑位置因素,查询的模糊向量表示完全由用户的兴趣确定;最后用模糊近似空间对关键词进行概念扩展,挖掘出相似概念类,计算文档和查询模糊表示的上、下近似集,文档和查询的匹配不再是关键词匹配,而是利用布尔逻辑的合取、析取公式对上、下近似集进行模糊匹配,并返回按相似度值排序的检索结果.仿真测试表明,方法能提高科技文档检索的性能,能对科技文献进行概念意义上的检索.  相似文献   

6.
基于模糊概念网络的信息检索模型研究   总被引:1,自引:0,他引:1  
陈颖明  许欢庆 《计算机工程》2005,31(21):146-147,150
提出一种基于模糊概念网络的信息检索模型,模型采用自学习算法完成模糊概念网络的自动构建,实现基于概念的信息检索。性能测试实验的结果表明:提出的检索模型具有较好的性能。  相似文献   

7.
乔亚男  齐勇  史椸  侯迪  王晓 《计算机科学》2009,36(7):197-201
传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是定义的临近词检索问题.提出了基于权重矩阵的临近词检索问题解决框架,该框架将文档和查询抽象化为文档的权重矩阵表示和查询权重矩阵,通过计算两个矩阵间的相似度来实现临近词检索.实验结果证明,针对临近词检索问题,传统的信息检索模型只是一种简化问题的解决方案,权重矩阵框架从理论上和形式上更加契合临近词检索问题,查准率得到了显著的提高.  相似文献   

8.
隐含语义索引及其在中文文本处理中的应用研究   总被引:33,自引:0,他引:33  
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。  相似文献   

9.
文档检索是自然语言处理的研究热点,相对于短文本文档具有信息丰富且冗长的特征。在长文本检索中,查询语句与长文本中的句子往往不是全部相关,可能会出现某些高相似片段的强干扰,因此查询语句与文档之间的相关性评分不能简单采用基于词语或字符串之间的相似度计算。提出了一种文本片段化机制(TSM)进行文档检索,首先将每个候选文档划分成片段,再计算查询语句与文档片段之间的相关度,所使用的相关度匹配方案考虑了语义和词频等因素,筛选出关键的文本片段并得出相关片段比率,综合这些片段信息计算查询与文档之间的相关性得分,从而获取Top-K文档集。针对Glasgow信息检索专用数据集的实验结果表明,利用文本片段化机制进行文本匹配可以提高信息检索的性能。  相似文献   

10.
一种基于锚文本的并行检索策略   总被引:1,自引:0,他引:1       下载免费PDF全文
高珊  何婷婷  胡文敏 《计算机工程》2008,34(19):30-31,3
进行Web信息检索时,页面中的锚文本与正文存在较大相关性,多数检索系统忽视了锚文本对页面正文的贡献。该文提出一种提高检索精度的方法,为文档集建立一个基于页面正文的索引和一个基于锚文本的索引,对其采取并行检索策略。实验结果表明,该方法可以有效处理特定结构的网页集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号