首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 73 毫秒
1.
2005年度863信息检索评测方法研究和实施   总被引:1,自引:0,他引:1  
本次863中文信息检索评测的目的是检测互联网环境下大规模数据的中文信息检索技术的研究现状和系统有效性,中文与接口技术评测组综合考虑了目前信息检索面临的难点以及中文信息检索具有的特点设计了本次信息检索评测,本文详细描述了本次评测的组织过程,包括查询条件设计,语料库情况,标准答案查找方法以及评价指标和评测软件的介绍,通过对参评队伍的结果数据进行分析并结合查询条件的类型,本文还讨论了现有检索技术的优点以及存在的不足.  相似文献   

2.
中文WEB文档自动分类是中文自动信息检索的核心技术之一.中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题.  相似文献   

3.
基于可信度的中文完整词自动识别   总被引:1,自引:0,他引:1  
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。  相似文献   

4.
基于向量空间模型的中文信息检索技术研究   总被引:15,自引:1,他引:15  
该文运用在西文信息检索中非常成功的向量空间模型来解决中文信息检索的问题,在中文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,并建立系统原型,在小范围内进行了测试。  相似文献   

5.
中文分词对中文信息检索系统性能的影响   总被引:7,自引:0,他引:7  
中文分词作为中文信息处理最重要的预处理手段被广泛应用,该文从两个方面(检索精度和召回率)深入研究了中文分词精度和分词算法对中文信息检索性能的影响。此外,提出了两个假设,并在此基础上给出了一种提高中文信息检索系统性能的方法。实验表明,新方法能够取得很好的结果,证实了这两个假设。  相似文献   

6.
基于p范式模型的检索   总被引:3,自引:0,他引:3  
随着电子文本的大量涌现,人们对信息检索工具提出了更高的要求。本文介绍一种扩展的布尔检索模型及其在中文信息检索系统中的应用,并利用相关反馈技术改善检索系统性能。  相似文献   

7.
基于文档实例的中文信息检索   总被引:2,自引:0,他引:2  
传统的信息检索系统基于关键词建立索引并进行信息检索.这些系统存在查询返回文档集大、准确率低和普通用户不便于构造查询等不足.为此,该文提出基于文档实例的信息检索,即以已有文档作为样本,在文档库中检索与样本文档相似的所有文档.文中给出了基于文档实例的中文信息检索的解决方法和实现技术.初步实验结果表明该方法是行之有效的.  相似文献   

8.
一个中文全文检索系统的设计与实现   总被引:3,自引:0,他引:3  
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统。在此系统中,提出了相应的数据采集方案、数据存储格式、数据压缩和信息检索机制。  相似文献   

9.
隐含语义索引及其在中文文本处理中的应用研究   总被引:33,自引:0,他引:33  
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。  相似文献   

10.
信息过滤是海量信息检索的重要手段之一,中文网络文本过滤系统在我国更具有明显的应用价值。该文介绍实现的一个中文网络文本过滤系统;该系统包括中文预处理、特征项选择、权重计算和分类等功能模块,可以方便地实现对中文网络文本的过滤功能。同时对系统采用的文本过滤算法的性能进行了测试。该系统具有一定的可扩充性和通用性。  相似文献   

11.
当前取证信息自动检索系统未对取证信息潜在检索风险进行过滤,导致对取证信息的检索风险控制效果差、检索效率低、误差高的问题,为此设计一种总线网络取证信息自动检索风险控制系统。将输入的取证信息在采集模块中进行收集,检索风险控制模块对采集的取证信息信息进行风险过滤和风险控制后,发送给DSP进行自动检索,采用STM32F407设计接口电路连接采集模块和检索风险控制模块,完成硬件部分的改进;选择高检索相关度节点,利用节点内置文档实现取证信息检索风险的控制,完成软件部分设计。实验结果表明,该系统的检索风险控制效果好,控制精度可达到80%以上,能够为用户提供更有效、更安全的权证信息检索结果。  相似文献   

12.
基于多用户协同反馈的信息检索模型   总被引:4,自引:0,他引:4  
随着WWW资源的不断增加,提高信息检索的质量变得十分重要.在这个过程中,根据检索用户的特点,充分考虑检索用户的意见对信息检索的质量和效率起到越来越重要的作用.本文将网络用户分为个人、社区和正规组织用户三种,通过分析不同类型用户的特点以及当前信息检索模型的基础上,提出了针对组织用户的基于多用户协同反馈的信息检索模型.该模型提出适用于正规组织用户的协同反馈的概念,并应用到信息检索领域.多用户协同反馈的概念根据正规组织用户的特点,充分考虑组织内所有协作人员的意见,结合最近一次检索结果,对用户查询请求不断进行修正后反复进行检索,从而有效提高了信息检索系统的精度和信息检索的协同工作能力.  相似文献   

13.
在社会日益多元化的今天,对于数据库的动态图像信息检索的性能要求也越来越严格。传统的图像信息检索系统存在检验图像完好率与检索图像准确率方面较差、检索的速度较慢等问题,已经不能满足当下人们对图像信息检索的需求,为此,提出了一种远程分布式数据库动态图像信息检索系统设计。首先根据远程分布式数据库的特点,设计出了动态图像的检索硬件系统框图;然后基于动态图像特征检索算法对软件进行了设计;最后进行了对比的实验。实验结果证明,该系统设计具有分布性广、通信良好以及稳健性较强的优点,检验图像完好率与检索图像准确率较高,速度较快,适应分布式的管理模式对机构进行控制,在经济上的性能也比较优越,可靠性与可用性较强,扩展性能极好,有益于多图像的共同检索。  相似文献   

14.
当前信息技术不断发展,人们对于信息系统的应用日益广泛,对于信息管理系统的要求也越来越高。利用当前最流行编程语言JAVA设计全文检索系统可以有效解决当前信息系统面临的问题。首先通过对Lucene架构的原理进行有效的分析,其次在其基础上设计出全文检索系统的框架,最后给出具体的检索模块的实现,并给出部分代码。对于信息管理人员来说具有积极的推动作用。  相似文献   

15.
Although search engines are essential tools for finding information on the World Wide Web, the effective use of search engines for information retrieval (IR) is a crucial challenge for any Internet user. Based on the user-focused approach, this study investigates individual information retrieval behaviors using information processing theory. The results show that experience with search engines significantly affects users’ attitudes toward search engines for information retrieval, the query-based service is more popular than the directory-based service, users are not completely satisfied with the precision of retrieved information and the response time of search engines, and users’ motivation is a key factor that predicts their intention to use search engines for information retrieval. Furthermore, this study proposes a conceptual model for investigating individual attitudes toward search engines for information retrieval.  相似文献   

16.
Temporal features, such as an explicit date and time or a time-specific event, employ concise semantics for any kind of information retrieval. Therefore, temporal features should be suitable for linked data information retrieval. However, we have found that most linked data information retrieval techniques pay little attention to the power of temporal feature inclusion. We propose a keyword-based linked data information retrieval framework ‘ that can incorporate temporal features and give more concise results. The evaluation of our system performance indicates that it is promising.  相似文献   

17.
郭立新  吴頔 《电脑学习》2012,2(2):34-35,37
随着计算机技术在围棋运动中的广泛应用,围棋棋谱的检索也成为围棋信息化的重要需求。传统的棋谱检索不能反映着法的内容,在应用上受到很大限制。介绍一种基于局面的棋谱检索算法,通过对棋子位置建立索引,将搜索直接建立在棋局内容的基础上。算法具有占用存储空间小、检索速度快、准确率高的特点,具有较高的实用价值。  相似文献   

18.
本文概述了信息源的分类,对信息检索的概念做了简单的描述。对于经典的布尔检索、向量空间检索、概率检索做了比较详细的分析,并且对信息检索模型的发展方向做了一定的介绍。  相似文献   

19.
随着Web的飞速发展,使得信息量激增,通过传统的信息检索技术来获取精确且对用户有价值的数据信息显得越来越困难。概念格作为形式概念分析中的核心数据结构,是进行数据分析的有力工具,将其引入信息检索系统能够提高检索的查全率和查准率,而智能Agent能给传统的信息检索系统带来智能化和个性化。本文将这两种技术相结合,提出一种基于概念格的多Agent信息检索系统模型,并给出它的框架结构和功能设计。  相似文献   

20.
目前随着信息检索技术的不断深入,信息检索技术中的聚类分析也得到了不断的发展,特别是随着各种数据源的大量涌现,如图像数据,文本数据,DNA数据,时间序列数据,Web数据等等,聚类分析越来越受到重视,对聚类的研究已经成为信息检索领域中一个非常活跃的研究课题。论文以聚类分析方法为理论基础,利用面向对象编程技术完成了一个聚类软件,应用该聚类软件,可对信息实现快速检索,具有实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号