期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于向量空间模型的中文信息检索技术研究 总被引：15，自引：1，他引：15

杨小平丁浩黄都培《计算机工程与应用》2003,39(15):109-111

该文运用在西文信息检索中非常成功的向量空间模型来解决中文信息检索的问题,在中文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,并建立系统原型,在小范围内进行了测试。相似文献

2.

陈治平林亚平童调生《计算机研究与发展》2002,39(10):1233-1237

N层向量空间模型在传统向量空间模型的基础上提出了的一种新的信息检索算法模型，这种模型将一篇文档从逻辑上划分为N个相对独立的文本段，然后按照文本段的内容建立文本特征向量以及文本权值向量，在此模型的基础上，更为精确地定义了特征值向量和相似度的计算方法，使之能比较好地适应文档集合的动态扩充，理论分析和实验结果表明，基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率。相似文献

3.

基于多层向量空间模型的Web信息检索方法 总被引：1，自引：0，他引：1

雷景生《计算机应用》2004,24(4):26-27,30

针对Web信息检索的特点,在分析传统向量空间模型存在问题的基础上,提出了一种多层向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段。按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。相似文献

4.

基于改进向量空间模型的Web信息检索技术研究 总被引：12，自引：1，他引：12

雷景生林冬雪符浅浅《计算机工程》2005,31(1):14-16

提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。相似文献

5.

基于空间向量模型的网络信息检索系统设计

丁艳风刘肖飞《信息与电脑》2023,(1):210-212

为提高网络信息检索系统的查全率和查准率,引入空间向量模型设计网络信息检索系统。首先,基于网络信息检索系统结构基本框架采集和预处理网络信息文档。其次,引入空间向量模型计算文本段与查询式相似度。再次,根据相似度计算公式设置不同网络信息文档的相似度门槛值。最后,基于相似度门槛值过滤网络信息检索,将过滤后的网络信息作为检索结果显示给系统用户。通过对比实验的方式证明,新的检索系统可根据用户输入内容给出查全率和查准率较高的检索结果。相似文献

6.

向量空间模型中的用户模型建立方法探讨

和海莲曾玉华《福建电脑》2007,(7):63-63,75

传统的向量空间模型信息检索技术,只是简单的统计检索信息在文档中出现的频度,检索结果时常欠缺查全率与查准率,作者在此基础上提出了用户模型的建立方法,借助辅助个性化信息库设计了新的用户模型,改进了信息检索方法,提高了信息检索的智能化程度. 相似文献

7.

一种基于超链接结构的向量空间模型改进算法

原福永褚蓓蓓《中文信息学报》2005,19(4):69-71,77

在基于向量空间模型的信息检索系统中,TF2IDF 算法被广泛的应用在基于关键字的信息检索中。然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接的网页内容考虑进去。本文分析了向量空间模型的实质,并找出了其精度低的原因,在传统模型基础上提出了一种基于网页超链接结构的向量空间模型改进算法。实验分析表明改进后的算法与原算法相比检索精确度提高了10 % ,在一定程度上改善了检索效果。相似文献

8.

基于统计语言模型的信息检索 总被引：4，自引：0，他引：4

李晓光王大玲于戈《计算机科学》2005,32(8):124-127

本文对基于统计语言模型的信息检索进行了综述,介绍了目前基于统计语言模型信息检索中比较有代表性的模型,给出了语言模型估计中常用的几种平滑技术,将语言模型同目前流行信息检索模型进行了比较,在此基础上,指出了基于统计语言模型信息检索的研究方向。相似文献

9.

一种基于本体语义的信息检索模型

纪兆辉《计算机与数字工程》2010,38(11):118-121

对基于向量空间模型的检索方法进行改进,提出基于本体语义的信息检索模型。将WordNet词典作为参照本体来计算概念之间的语义相似度,依据查询中标引项之间的相似度,对查询向量中的标引项进行权值调整,并参照Word-Net本体对标引项进行同义和上下位扩展,在此基础上定义查询与文档间的相似度。与传统的基于词形的信息检索方法相比,该方法可以提高语义层面上的检索精度。相似文献

10.

基于向量空间的信息检索模型的改进 总被引：1，自引：0，他引：1

原媛彭建华张汝云《计算机工程与设计》2008,29(23)

向量空间模型是有代表性的信息检索模型之一,针对该模型存在的问题进行了研究和探讨.在仅用统计词频表-示文档向量方面,引入知网作为语义知识库,提出基于概念的特征选择模型;在因词语的同义和多义,不能满足文档向量相互独立方面,提出潜在语义索引模型.实验验证了改进后的检索模型更能体现文本的内容,降低文本向量的维数,提高检索的准确率. 相似文献

11.

基于N-Level VSM在Web信息检索中的研究

付克志林鸿飞《计算机工程与应用》2006,42(19):158-160,179

分析了传统向量空间检索模型在Web信息检索中的不足,给出了基于N-Level向量空间模型,这种模型是将一篇文档从逻辑上划分为N个相对独立的文本段,然后按照文本段的内容建立文本特征向量以及文本权值向量,在此基础上可以更加精确地定义特征值向量和相似度的计算方法,使之能比较好地适应文档集合的动态扩充。同时进行了两种模型算法时间的复杂度的比较分析。理论分析和实验结果表明,基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率。相似文献

12.

一种基于锚文本的并行检索策略 总被引：1，自引：0，他引：1

下载免费PDF全文

高珊何婷婷胡文敏《计算机工程》2008,34(19):30-31,3

进行Web信息检索时,页面中的锚文本与正文存在较大相关性,多数检索系统忽视了锚文本对页面正文的贡献。该文提出一种提高检索精度的方法,为文档集建立一个基于页面正文的索引和一个基于锚文本的索引,对其采取并行检索策略。实验结果表明,该方法可以有效处理特定结构的网页集。相似文献

13.

基于向量空间模型的个性化信息过滤系统研究与开发磁

许琦《计算机与数字工程》2014,(10)

论文提出了一种基于向量空间模型的用户个性化需求建模方法。对关键词权重算法作出改进,将网页分为四类逻辑段,通过计算关键词在各类逻辑段中的权重而加权得到综合权重。采用基于内容的构建原则和反馈原则,将用户模型构建分为训练阶段和自适应学习阶段。在训练阶段由用户给出的样本文档与关键词采用类重心分类算法训练得到初始用户模型;在自适应学习阶段,提出了基于 Rocchio 算法的周期性自适应学习机制,根据用户对过滤结果的评价,调整用户模型,以提高对用户个性化需求的动态追踪能力。开发了个性化信息过滤原型系统。以中国服装网为实验数据源,对比百度搜索引擎,测试系统的信息过滤性能。实验结果表明,系统索引更新及时,响应速度快,返回的信息更精确,更合理,更加符合用户的实际需求。相似文献

14.

基于p范式模型的检索 总被引：3，自引：0，他引：3

迟呈英战学刚姚天顺《中文信息学报》2000,14(4):35-41

随着电子文本的大量涌现,人们对信息检索工具提出了更高的要求。本文介绍一种扩展的布尔检索模型及其在中文信息检索系统中的应用,并利用相关反馈技术改善检索系统性能。相似文献

15.

一种改进的向量空间信息检索模型研究

东兴贾宇波王义范红丹《工业控制计算机》2011,24(5):66-67

传统的信息检索方法忽略了文档结构对词的重要性.在此基础上,提出了改进的向量空间检索模型,利用该模型进行相似度计算.试验表明该模型可以提高信息检索的查准率和查全率不高的缺点. 相似文献

16.

基于语言概念空间的跨语种信息检索模型

下载免费PDF全文

吴晨张全缪建明《计算机工程》2006,32(18):9-11,1

提出了一种基于语言概念空间的跨语种信息检索模型，该模型以建立在语言概念空间中的形式化语境单元框架表示处理所需的中间信息，通过用以描述语境单元框架的语义符号间的匹配和生成机制来实现文本的跨语种检索，有助于避开用形式多样的具体语言作为处理中介存在的模糊消解问题。实验证明，这一模型显著改善了检索系统的性能。相似文献

17.

基于分块颜色相关向量的图像检索算法

唐波孙茂印《微计算机应用》2007,28(6):561-565

阐述了颜色相关向量的基本概念，提出了分块颜色相关向量相似性度量的计算方法和相关区域快速搜索算法，最终形成基于分块颜色相关向量的图像检索算法。实验表明，算法更符合人的主观感觉。相似文献

18.

Web搜索中基于免疫克隆算法的信息检索方法

下载免费PDF全文

杨毅吴绍兴《计算机工程与科学》2010,32(5):124-125

随着万维网上信息的爆炸性增长,导致需要大量有效的信息检索方法。本文对传统的向量空间模型进行了优化,并提出一种基于克隆选择算法的Web搜索方法。通过对查询结果的精确率和混合检索率进行比较,表明该算法能有效提高Web搜索引擎的质量和运行效率。相似文献