首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
N层向量空间模型在Web信息检索中的应用   总被引:2,自引:0,他引:2  
在传统向量空间模型的基础上,提出一种新的信息检索算法模型——N层向量模型。此模型应用在Web信息检索上,能较好地适应文档集合的动态扩充。  相似文献   

2.
基于N层向量空间模型的信息检索算法   总被引:14,自引:0,他引:14  
N层向量空间模型在传统向量空间模型的基础上提出了的一种新的信息检索算法模型,这种模型将一篇文档从逻辑上划分为N个相对独立的文本段,然后按照文本段的内容建立文本特征向量以及文本权值向量,在此模型的基础上,更为精确地定义了特征值向量和相似度的计算方法,使之能比较好地适应文档集合的动态扩充,理论分析和实验结果表明,基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率。  相似文献   

3.
白田恬  邢永康 《计算机科学》2006,33(B12):245-248
本文依次介绍了信息检索的三类数学模型——集合模型、代数模型和概率模型,并对这三类信息检索模型的检索效果进行了分析。在此基础上提出了一种实用的信息检索方法,我们称为二次检索方法。该方法基于布尔模型和向量空间模型,综合了两者的特点,从而有效地提高了信息检索的效果。文章最后通过实验,对二次检索方法、布尔模型、向量空间模型的查全率、查准率进行了比较,验证了二次检索的优点。  相似文献   

4.
矢量相关模型VCM是当前流行的信息检索模型之一。本文将模糊集理论和方法引入检索模型的构造,提出了一种模糊矢量相关模型FVCM,从而对其理论结构及用户检索模式的表达机制做了模糊化改进。初步实验表明,新模型克服了原模型的一些固有缺陷,有利于提高系统查准率和查全率。  相似文献   

5.
矢量相关模型VCM是当前流行的信息检索模型之一.本文将模糊集理论和方法引入检索模型的构造,提出了一种模糊矢量相关模型FVCM,从而对其理论结构及用户检索模式的表达机制做了模糊化改进.初步实验表明,新模型克服了原模型的一些固有缺陷,有利于提高系统查准率和查全率.  相似文献   

6.
基于特征提取的中文检索方法研究   总被引:1,自引:0,他引:1  
程华 《福建电脑》2006,(12):36-36,23
本文介绍了布尔检索模型、概率检索模型、向量空间检索模型,详细分析了基于字、词、内容为提职特征的中文检索方法及各自的特点。  相似文献   

7.
本项目是以提高查准率为目标,研究搜索引擎所需的关键技术,在该门户内建立一个高性能的搜索引擎。根据项目要求,在对搜索引擎各项技术研究的基础上,提出基于元搜索引擎的网络信息检索系统架构技术,并建立个人知识库,实现符合用户检索要求的个性化检索。  相似文献   

8.
在基于向量空间模型的信息检索系统中,TF2IDF 算法被广泛的应用在基于关键字的信息检索中。然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接的网页内容考虑进去。本文分析了向量空间模型的实质,并找出了其精度低的原因,在传统模型基础上提出了一种基于网页超链接结构的向量空间模型改进算法。实验分析表明改进后的算法与原算法相比检索精确度提高了10 % ,在一定程度上改善了检索效果。  相似文献   

9.
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在语义分析生成的语义索引库,进行语义检索。通过多组实验分析确定了该模型所采用的词条权重计算方法和语义空间维数。最后,通过实验分析对比了改进后的潜在语义检索模型(ALSI)与传统潜在语义检索模型(LSI)的检索效果。结果表明,ALSI的检索效果明显好于LSI,适合应用于较大规模农业信息检索。  相似文献   

10.
基于XML和N层VSM的Web信息检索   总被引:1,自引:1,他引:1  
基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法。  相似文献   

11.
分析了传统向量空间检索模型在Web信息检索中的不足,给出了基于N-Level向量空间模型,这种模型是将一篇文档从逻辑上划分为N个相对独立的文本段,然后按照文本段的内容建立文本特征向量以及文本权值向量,在此基础上可以更加精确地定义特征值向量和相似度的计算方法,使之能比较好地适应文档集合的动态扩充。同时进行了两种模型算法时间的复杂度的比较分析。理论分析和实验结果表明,基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率。  相似文献   

12.
基于改进向量空间模型的Web信息检索技术研究   总被引:12,自引:1,他引:12  
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

13.
在信息时代,面对日益庞大的信息资源,需要通过一种科学手段来获取自己需要的准确及时的信息,这种科学的手段就是检索,信息检索。信息检索就是只从任何文献集合中查出所需信息的活动、过程和方法。通过论述信息检索的工作原理和其在网络环境下的作用,对比分析了基于网络的信息检索几种类型的特点,对高速而有效的信息检索系统的核心技术搜索引擎技术进行了分析,指出随之带来的亟待解决的快速有效获取信息的问题和搜索引擎技术符合时代要求的发展方向。  相似文献   

14.
周瑛  张铃 《微机发展》2007,17(1):111-113
评价一个信息检索系统的标准是该系统在多大程度上满足用户的能力。文中从传统的评价信息检索系统的两大标准———计算查全率和查准率的公式出发,结合实际情况,考虑检索结果相关性是一个模糊的概念,为了对这个模糊的概念以客观的度量,应用模糊集的方法对传统的查全率和查准率的公式进行了两种修改。一种修改是在每篇文档对总的查全率和查准率的影响相同时进行的,而第二种修改则是在每一类文档对总的查全率和查准率的影响相同时进行的。这两种修改是对传统的基于二值相关性的检索评价系统的有效扩充。  相似文献   

15.
基于多层向量空间模型的Web信息检索方法   总被引:1,自引:0,他引:1  
雷景生 《计算机应用》2004,24(4):26-27,30
针对Web信息检索的特点,在分析传统向量空间模型存在问题的基础上,提出了一种多层向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段。按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

16.
基于向量空间模型的信息检索技术是较为成熟且应用广泛的信息检索技术,该技术将文档和查询信息均用向量空间表示,查询匹配问题转化为向量空间的矢量匹配问题,文档与查询的相似度可用向量之间的夹角来度量.信息检索速度是衡量信息检索技术好坏的重要指标,基于向量空间模型的信息检索之串行算法的计算复杂度为θ(n^3),本文提出了一种在Hypercube SIMD模型上的并行算法,其时间计算复杂度为θ(nlogn),该算法与传统的串行算法相比,能显著地提高查询速度.  相似文献   

17.
信息检索算法评价指标的分析与改进   总被引:2,自引:0,他引:2  
信息检索算法评价指标是评价信息检索算法性能的根本依据,也是我们改进算法的出发点。本文指出了现有评价指标的不足,着重分析了信息检索算法的评价指标中查准率、回调率的变化趋势和规律,并根据这种变化趋势提出了一种综合的评价方法和指标。  相似文献   

18.
论述了信息检索含义,对比分析了不同的网络环境下信息检索类型的特点,对www环境下搜索引擎系统进行了分析,总结论述了其集中/分布式搜索引擎的核心问题和4种设计方案。  相似文献   

19.
WEB信息检索与WEB数据挖掘   总被引:12,自引:0,他引:12  
首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从而提高WEB信息检索的效率和质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号