首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
白田恬  邢永康 《计算机科学》2006,33(B12):245-248
本文依次介绍了信息检索的三类数学模型——集合模型、代数模型和概率模型,并对这三类信息检索模型的检索效果进行了分析。在此基础上提出了一种实用的信息检索方法,我们称为二次检索方法。该方法基于布尔模型和向量空间模型,综合了两者的特点,从而有效地提高了信息检索的效果。文章最后通过实验,对二次检索方法、布尔模型、向量空间模型的查全率、查准率进行了比较,验证了二次检索的优点。  相似文献   

2.
目前较流行的文本信息检索方法是全文检索,但全文检索实现起来较为困难,而且不一定能满足各种用户的需要。本文介绍了一种用数据库及WWW来实现文本信息检索的的方法,此方法简单、实用,具有较好的推广价值。  相似文献   

3.
一种基于领域本体的混合信息检索模型   总被引:3,自引:2,他引:3       下载免费PDF全文
针对语义检索中本体不能提供所有知识的问题,提出一种基于领域本体的混合信息检索模型。该模型利用领域本体中概念间的语义关系,结合关键词检索和语义检索,建立关键词基础矩阵和语义扩展矩阵两层索引矩阵,使系统检索在没有可用本体知识时能自动调整为关键词检索,保证一定的检索性能。两者的结合有效改善了检索性能。  相似文献   

4.
跨语言信息检索研究进展   总被引:12,自引:0,他引:12  
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言问的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。  相似文献   

5.
将时态信息融入到信息检索技术中可以有效提高检索效果,时态信息检索已有较多的研究,而现有数据库信息检索方法还缺乏对时态信息有效利用。针对这一研究问题,提出关系数据库上基于时态语义的关键词检索方法,引入时态信息构建时态数据图,设计时态相关性评分机制,在时态图搜索过程中引入时态语义约束,设计基于关键词的时态检索算法。实验验证了该方法可以有效提高数据库信息检索效果,而检索性能并没有降低。  相似文献   

6.
通过表格的形式将正则表达式的语法进行总结,同时给出一些常用的正则表达式,方便读者在相关方面的练习与应用。最后通过列举C#下正则表达式简单应用,将正则表达式的语法应用于C#编程实践中,更方便大家理解与应用。  相似文献   

7.
一种基于锚文本的并行检索策略   总被引:1,自引:0,他引:1       下载免费PDF全文
高珊  何婷婷  胡文敏 《计算机工程》2008,34(19):30-31,3
进行Web信息检索时,页面中的锚文本与正文存在较大相关性,多数检索系统忽视了锚文本对页面正文的贡献。该文提出一种提高检索精度的方法,为文档集建立一个基于页面正文的索引和一个基于锚文本的索引,对其采取并行检索策略。实验结果表明,该方法可以有效处理特定结构的网页集。  相似文献   

8.
在分析了基于协议分析技术的IDS不足的基础上,引入了正则表达式的技术,提出了基于正则表达式匹配的协议分析技术,给出了相应实现算法,并在实际构建IDS规则库时进行了试验,通过实验结果表明,运用正则表达式改善了误用检测中检测特征单一、无法检测新攻击的缺陷,扩展了检测变种攻击的能力,从而大大提高了检测的效率.  相似文献   

9.
针对现有信息检索系统难以按查询需求处理检索文档的问题,提出了一种基于相关反馈的信息检索模型,分析了查询词分解,推导了相关反馈机制和正规化过程,并进一步阐述了文档提取方法。提出的模型通过相关反馈和查询词扩展,克服了传统方法无法计算文档与查询词之间的相似度问题,并能有效地处理检索文档。仿真结果证明了该模型的有效性和可行性。  相似文献   

10.
周竹荣  黄果  周亭 《计算机工程与设计》2007,28(11):2671-2673,2710
通过对基于统计的信息检索模型和基于本体的信息检索模型进行分析比较,得知这两种模型在某种程度上互补:基于统计的信息检索模型强调关键字的统计信息,然而忽略了关键字之间的语义信息;基于本体的信息检索模型强调关键字之间的语义信息,然而忽略了关键字的统计信息.结合两种信息检索模型各自的优点提出了一种混合的信息检索模型,实验证明该模型在查全率和查准率方面较基于统计的信息检索模型和基于本体的信息检索模型有了一定的改进.  相似文献   

11.
基于VSM的中文信息检索   总被引:1,自引:0,他引:1  
本文介绍了在向量空间模型下,使用Cosine-Measure和OKAPI—Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过针对10字以内的短查询的实验分析。作者发现在相同召回率的情况下,使用OKAPI法来计算相似度得到的检索结果,准确率要比Cosine法的高。  相似文献   

12.
随着信息量的急剧增加,检索技术显得尤为关键.目前很多检索技术都是基于索引的检索技术.文中借助了Lucene的索引技术与检索机制,通过对索引信息的改进以及使用基于内容的改进方法,对Lucene结果与查询语句在向量空间中重新计算相似度,实现了对长段查询语句检索结果排序位置的提高.  相似文献   

13.
传统的文本检索技术主要面向一维文本,难以用于对二维结构数学表达式的检索.针对该问题,通过引入公式描述结构,实现基于运算符信息的数学表达式检索.利用公式描述结构提取算法获取LaTeX数学表达式的节点信息,从而得到公式骨架存储结构.在此基础上,选择运算符值为1的节点及其相关文档建立索引,并通过数学表达式匹配算法得到与输入相似的表达式集合.实验结果表明,该方法能够从519 588个数学表达式中快速、准确地找到相似表达式,并且不受一般运算数的影响.  相似文献   

14.
基于对等网络的全文信息检索   总被引:7,自引:0,他引:7  
基于P2P方式的信息检索系统相对集中式信息检索系统具有成本低、可扩展性好、容错性强等优点,可充分挖掘网络边缘资源,并可提供个性化的信息服务.然而如何在纯P2P环境下实现全文检索并定位目标资源是困难的.当前,采用广播查询的非结构化P2P(如Gnutella)和采用分布式Hash表方式的结构化P2P(如CAN)都不能直接实现全文检索.针对这个问题,提出了基于质心法的结构化P2P全文检索方法,并建立模拟程序,对检索的性能与效果做了初步的验证.实验结果表明了该方法的有效性.  相似文献   

15.
针对大容量模板库条件下固定音频检索面临检索速度慢的问题,提出一种基于模板子空间的快速固定音频检索方法.利用相同或相似音频数据间存在一定相关性的特点,采用基于模板子空间的方法快速筛选出相似度较高的候选模板集,对候选集内的所有模板进行精细检索以得到最终结果.实验结果表明,与已有方法相比,该方法可以在几乎不损失精度的情况下大幅提高检索速度.  相似文献   

16.
基于潜在语义分析的信息检索   总被引:14,自引:1,他引:14  
潜在语义分析是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。文章介绍了基于潜在语义分析的文本信息检索的基本思想、特点以及实现方法。  相似文献   

17.
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具忽视了很多文本中所隐含的语义信息,从而导致检索时效率低下,很难满足用户的查询要求.提出了一种基于向量空间模型改进的文本信息检索方法.把本体技术引入到传统的文本信息检索系统中,利用领域本体中概念相似度计算对向量空间模型进行改进,从而实现一个高效的文本检索系统,并简述了系统的模型.实例证明,该方法可以很好地提高文本信息检索的查全率和查准率.  相似文献   

18.
基于本体的Web文本挖掘与信息检索   总被引:1,自引:0,他引:1       下载免费PDF全文
艾伟  孙四明  张峰 《计算机工程》2010,36(22):75-77
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。  相似文献   

19.
面向中文短信的信息抽取方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在手机3D动画自动生成系统中,研究面向中文短信的信息抽取方法.设计一种基于上下文无关文法的模板定义方式,以及对应的模板知识库与模板解析器.在模板解析器处理数据的过程中,通过最左规约算法保证中文短信的信息抽取效率.实验结果表明,该方法在扩展抽取内容范围的同时,能提高信息抽取的准确性.  相似文献   

20.
为实现文本信息检索中的个性化推荐,本文以用户焦点作为用户个性特征的描述,设计了适用于快速分类的混合前向角分类神经元网络RealCC。以用户焦点作为样本数据训练该网络后,可以通过该网络对用户查询结果进行快速分类以获得每务查询结果的推荐优先级。给出了使用用户焦点训练该网络的算法。实验表明,RealCC可以在保持分类精度的同时快速的完成对数据的分类,同时,基于用户焦点的个性化推荐,可以有效地减轻用户因从包含大量无关信息的查询结果中筛选感兴趣信息而产生的负担,较好地满足了用户对文本信息检索的时间要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号