首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法.该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户.从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性.实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量.  相似文献   

2.
网络信息过滤的方法和技术研究   总被引:2,自引:0,他引:2  
论述了网络信息过滤的原理,从用户的信息需求与表示、文本的表示技术等方面探讨了网络信息过滤的方法和技术以及存在的问题,提出Vague集之间的相似度量在网络信息过滤中的应用。  相似文献   

3.
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。  相似文献   

4.
基于贝叶斯网络的信息过滤模型研究   总被引:8,自引:0,他引:8  
传统信息过滤模型很难描述对信息过滤结果产生影响的各种因素,如质量、内容、用户偏好之间复杂的关系,也无合适的方法让用户将知识加入到信息过滤系统中,因此,提出了基于贝叶斯网络的信息过滤模型BMIF(Bayesian model of information filtering),BMIF是贝叶斯网络的简化,它描述了信息过滤的基本结构,提供了6种节点用于描述影响信息过滤的事件之间的关系,在此基础上,提供了BMIF的各种使用方法,包括将传统方法使用BMIF描述,将词法知识用BMIF表示,以及将自动学习与手动交互结合,将合作过滤与内容过滤结合等。  相似文献   

5.
随着Internet的广泛应用,越来越多的信息以电子化方式存放在网上,但是信息获取手段的提高并没有满足信息增长的需要,导致了“信息过载”和“资源迷向”现象。虽然有许多信息检索和过滤工具被开发出来,然而,传统的搜索引擎信息服务系统没有有效的手段理解用户准确的信息需求,缺乏智能和个性。针对利用现有的搜索引擎进行信息检索的过程中存在的查准率低和用户无法跟踪网页信息变化的缺点,提出面向用户的个性化信息检索服务理念,在客户端建立基于关键词表的用户个性化信息检索模型。通过用户个性化信息检索模型内部各功能模块之间的通信协作达到面向用户的个性化主动信息检索服务。  相似文献   

6.
陈剑  张冬梅  陈钊 《计算机工程与应用》2012,48(14):134-138,162
目前信息推送服务广泛应用于各类电子商务网站,然而传统信息过滤技术在林产品贸易信息过滤的过程中,存在着不足。在总结林产品贸易信息过滤的特点的基础上,提出梯级过滤技术。该技术根据林产品贸易用户兴趣的不同、用户需求程度的不同、林产品贸易信息特征项权重的不同,在提出林产品贸易信息特征向量空间模型和分析用户兴趣特征向量结构的基础上,采用先进行用户显性需求的严格过滤,再进行用户显性需求的模糊过滤,再进行用户隐性需求的过滤的梯级过滤方法,从而达到准确满足用户需求的目的。实验结果证明该方法能够有效地过滤出用户满意的信息。  相似文献   

7.
为提高网络信息检索系统的查全率和查准率,引入空间向量模型设计网络信息检索系统。首先,基于网络信息检索系统结构基本框架采集和预处理网络信息文档。其次,引入空间向量模型计算文本段与查询式相似度。再次,根据相似度计算公式设置不同网络信息文档的相似度门槛值。最后,基于相似度门槛值过滤网络信息检索,将过滤后的网络信息作为检索结果显示给系统用户。通过对比实验的方式证明,新的检索系统可根据用户输入内容给出查全率和查准率较高的检索结果。  相似文献   

8.
信息过滤技术和个性化信息服务   总被引:23,自引:0,他引:23  
信息过滤技术是指根据用户兴趣帮助用户过滤掉那些他不感兴趣的信息。目前出现许多这方面的应用系统,通过对信息过滤概念的研究和与信息检索概念的比较,抽象出这类系统的一般模型,对其进行多角度的分类并在此基础上研究了信息过滤在个性化信息提供的关键技术。  相似文献   

9.
跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤三种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明: 在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。  相似文献   

10.
一种基于互联网智能元搜索引擎的研究   总被引:1,自引:0,他引:1  
包骏杰  马燕 《计算机科学》2004,31(6):103-105
WWW的迅速发展,使得开发新型的搜索引擎成为Web发展过程中亟待解决的问题之一。结合信息检索领域和人工智能领域最新的发展状况,本文提出了一种全新的解决方案——互联网智能元搜索引擎。文章在回顾已有的搜索引擎技术的基础上.首先提出了智能元搜索引擎的基本框架,之后详细介绍了实现的关键技术。这些技术包括:机器学习中的文本学习技术,中文文本表示技术,信息过滤技术,个性化用户建模技术等。  相似文献   

11.
网络时代提高信息服务质量的关键是信息筛选.网络信息影响力评价方法主要有搜索引擎收录情况、用户访问量统计和链接分析法,这些方法通过定量评价网络信息,有效地弥补了同行评议法等定性评价方法的不足.结合这些方法为用户检索关键有效信息提供了一些思路.  相似文献   

12.
Legal information retrieval is in need of the provision of legal knowledge for the improvement of search strategies. For this purpose, the LOIS project is concerned with the construction of a multilingual WordNet for cross-lingual information retrieval in the legal domain. In this article, we set out how a hybrid approach, featuring lexically and legally grounded conceptual representations, can fit the cross-lingual information retrieval needs of both legal professionals and laymen  相似文献   

13.
Most of the written materials are consisted of Multimedia (MM) information because beside text usually contain image information. The present information retrieval and filtering systems use only text parts of the documents or in best case images represented by keywords or image captions. Why do not use both, text and image features of the documents and in the retrieval or filtering process utilize more completely the document information content? Can such approach increase the effectiveness of retrieval and filtering processes? There is a very little difference between retrieval and filtering at an abstract level. In this paper, we will discuss some possible similarities and differences between them on the application level taking into account the experiments in retrieval and filtering of multimedia mineral information.  相似文献   

14.
WEBSOM is a recently developed neural method for exploring full-text document collections, for information retrieval, and for information filtering. In WEBSOM the full-text documents are encoded as vectors in a document space somewhat like in earlier information retrieval methods, but in WEBSOM the document space is formed in an unsupervised manner using the Self-Organizing Map algorithm. In this article the document representations the WEBSOM creates are shown to be computationally efficient approximations of the results of a certain probabilistic model. The probabilistic model incorporates information about the similarity of use of different words to take into account their semantic relations.  相似文献   

15.
当前取证信息自动检索系统未对取证信息潜在检索风险进行过滤,导致对取证信息的检索风险控制效果差、检索效率低、误差高的问题,为此设计一种总线网络取证信息自动检索风险控制系统。将输入的取证信息在采集模块中进行收集,检索风险控制模块对采集的取证信息信息进行风险过滤和风险控制后,发送给DSP进行自动检索,采用STM32F407设计接口电路连接采集模块和检索风险控制模块,完成硬件部分的改进;选择高检索相关度节点,利用节点内置文档实现取证信息检索风险的控制,完成软件部分设计。实验结果表明,该系统的检索风险控制效果好,控制精度可达到80%以上,能够为用户提供更有效、更安全的权证信息检索结果。  相似文献   

16.
With the number of documents describing real-world events and event-oriented information needs rapidly growing on a daily basis, the need for efficient retrieval and concise presentation of event-related information is becoming apparent. Nonetheless, the majority of information retrieval and text summarization methods rely on shallow document representations that do not account for the semantics of events. In this article, we present event graphs, a novel event-based document representation model that filters and structures the information about events described in text. To construct the event graphs, we combine machine learning and rule-based models to extract sentence-level event mentions and determine the temporal relations between them. Building on event graphs, we present novel models for information retrieval and multi-document summarization. The information retrieval model measures the similarity between queries and documents by computing graph kernels over event graphs. The extractive multi-document summarization model selects sentences based on the relevance of the individual event mentions and the temporal structure of events. Experimental evaluation shows that our retrieval model significantly outperforms well-established retrieval models on event-oriented test collections, while the summarization model outperforms competitive models from shared multi-document summarization tasks.  相似文献   

17.
Legal text retrieval traditionally relies upon external knowledge sources such as thesauri and classification schemes, and an accurate indexing of the documents is often manually done. As a result not all legal documents can be effectively retrieved. However a number of current artificial intelligence techniques are promising for legal text retrieval. They sustain the acquisition of knowledge and the knowledge-rich processing of the content of document texts and information need, and of their matching. Currently, techniques for learning information needs, learning concept attributes of texts, information extraction, text classification and clustering, and text summarization need to be studied in legal text retrieval because of their potential for improving retrieval and decreasing the cost of manual indexing. The resulting query and text representations are semantically much richer than a set of key terms. Their use allows for more refined retrieval models in which some reasoning can be applied. This paper gives an overview of the state of the art of these innovativetechniques and their potential for legal text retrieval.  相似文献   

18.
互联网上大部分的数字化信息都与地球上的地点和位置关联,信息检索查询中大量地包含地理信息,传统的基于关键字匹配方法没有考虑检索中的空间关系,无法满足此类检索需求。地理信息检索根据地理范围从文档中获取空间语义匹配的地理知识文档,成为国内外信息检索和GIS领域的热点研究方向。提出了一个地理信息检索的基本系统框架,依据该框架对地理信息知识库、地理信息抽取、地理信息检索模型、混合索引和检索可视化等关键性技术进行了分类概括总结。在对已有技术进行深入对比分析的基础上,指出了该领域未来的研究工作和面临的挑战,并提供了大量的参考文献。  相似文献   

19.
王永平 《计算机工程》2010,36(24):27-29
为满足用户广泛、准确、快速获取文物信息的要求,设计了数字博物馆文物信息获取系统。在设计过程中采用多线程、信息再过滤、信息重新分类等技术,对信息获取、信息分析、信息分类技术进行改进,解决了目前数字博物馆存在的信息来源局限性的问题,同时提高信息的准确性,使文物信息分类清晰,从而实现了文物信息的快速检索。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号