首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于Web的智能信息获取研究   总被引:5,自引:0,他引:5  
本文讨论了当前信息检索领域的先进搜索技术和Agent信息获取技术。从应用的角度提出一利新的智能信息获取方法,包括分词过程、止滤过程、词频计算过程和取舍过程。为进步满足Web信息检索提供一种个性化的高效信息检索二具。  相似文献   

2.
所谓Web信息检索,是指在海量的网络信息中,搜索出符合用户需要的信息。这是一种快速查找的信息检索方式,但是存在的问题是缺乏个性化,因为用户在输入关键词之后,会检索出来大量的信息,真正符合用户需求的信息可能不会排列在靠前的位置,从而使用户搜寻所需信息变得困难。因此,为了更好的使用户检索到所需的信息,就有了个性化Web信息检索系统的研究。本文通过设计思想的阐述,提出了个性化Web信息检索系统的设计与实现。  相似文献   

3.
个性化搜索引擎系统机制的研究   总被引:2,自引:0,他引:2  
随着网络信息资源的迅速增加,个性化信息服务越来越成为信息检索领域中研究的热点,针对传统搜索引擎系统的缺点,提出了一种新型个性化搜索引擎系统的体系结构,并在此基础上给出了系统中个性化机制的相关算法,同时使用基于关键词的搜索,利用Web挖掘技术,在实现为不同用户提供不同检索结果的同时提高了个性化查询的精确度和速度,保证了全查率.  相似文献   

4.
基于元数据与Z39.50的分布协作式Web信息检索   总被引:21,自引:0,他引:21  
Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供Web信息检索已经成为一项重要的研究课题.Web搜索引擎部分地解决了信息检索问题,然而其效果却远远不能令人满意.提出了Web信息检索的分布协作策略以取代传统的集中式信息检索方式;给出了一种新的Web信息检索系统模型,该模型支持对Web文档的元数据进行检索,并采用Z39.50协议作为接口标准,以克服不同信息检索系统之间的访问异构性.在此基础上,设计了一个分布协作式Web信息检索框架,用以帮助用户有效地进行Web信息检索.  相似文献   

5.
数字图书馆个性化信息检索中信息推送技术的应用研究   总被引:1,自引:0,他引:1  
本文介绍了数字图书馆系统中个性化信息检索的概念及发展、个性化信息检索的原理等,重点阐述了个性化信息检索中的信息推送技术的实现原理与方式。  相似文献   

6.
数字图书馆个性化信息检索中信息推送技术的应用研究   总被引:2,自引:0,他引:2  
本文介绍了数字图书馆系统中个性化信息检索的概念及发展、个性化信息检索的原理等.重点阐述了个性化信息检索中的信息推送技术的实现原理与方式。  相似文献   

7.
针对根据目前网络信息检索存在的查全率和查准率低的特点,提出一种个性化的局部上下文分析方法,以提高Web信息检索的性能.该方法通过设计一种客户端的用户兴趣挖掘模型,同时将用户兴趣模型与局部上下文分析方法相结合,克服了局部上下文分析的缺陷.实验结果显示该方法能有效提高Web信息检索的查全率与查准率.  相似文献   

8.
基于Web信息组织模型的元数据检索技术   总被引:1,自引:0,他引:1  
高玉珠  刘瑞 《计算机应用》2006,26(Z1):89-90
针对目前互联网搜索引擎主要使用全文检索技术,无法从Web页面中提取元数据信息情况,设计了一个基于信息组织模型的Web元数据信息提取和检索系统.使用基于正则表达式的元数据信息提取模型,信息提取和索引程序不断从数量巨大的Web页面中提取元数据信息,对本地元数据库进行不断地更新.抽象了多种Web信息组织模型,设计了相应的信息检索模型,并且这些模型可以大范围地应用于提取Web站点的元数据,所采用的方法充分利用了Web页面的数据结构,避免了采用复杂的语法、语义分析,为面向多个领域的元数据信息检索做出了一定的研究和探索.  相似文献   

9.
传统的网络信息检索技术如搜索引擎存在一些不足,一方面它只是将信息搜寻出来,不能发现隐藏在数据背后的知识;另一方面其采集软件在采集数据时缺乏人工干预,智能性不强,导致信息利用率不高.针对传统的Web搜索引擎存在的上述问题,结合Web文本挖掘、XML、BP神经网络在数据处理方面的长处,提出了一个具有一定智能的Web文本信息检索模型,以使其具有较高的信息利用率.  相似文献   

10.
介绍了本体Ontology的概念和理论知识,提出一种基于本体的Web信息检索模型.该模型利用本体技术对Internet上的各类信息进行领域分类,规范用户信息检索模式,以达到快速、准确找到用户所需信息的目的.  相似文献   

11.
支持个性化检索的User Profile研究概述   总被引:2,自引:0,他引:2  
在现代搜索系统中,由于网络信息的动态性和用户兴趣的迁移性,通常的检索技术已难以满足用户的个性化需求,个性化搜索势在必行.User Profile作为描述用户兴趣和爱好的载体和手段,是个性化搜索领域的重要组成部分之一.本文论述了User Profile的创建、学习、存储、更新及其在个性化搜索系统中发挥的作用等,分析在相关反馈过程中,利用User Profile进行查询扩展的具体过程.针对向量空间模型和概率模型,分别讨论了User Profile的更新问题.最后,展望了User Profile的发展方向,得出"基于本体的User Profile是目前和将来最具潜力的方法"的结论.  相似文献   

12.
基于P2P的个性化Web搜索系统的设计与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
针对中心化的Web信息搜索系统在覆盖率、及时性、个性化、可扩展性等方面存在的问题,提出了一种基于Peer-to-Peer(P2P)的可扩展、个性化的Web搜索系统PeerBridge。PeerBridge基于分布式哈希表组织大量的网络结点形成有组织的P2P覆盖网络,每个对等体作为一个主题搜索引擎,根据用户兴趣从Web中搜索特定主题相关的信息,而具有相似主题的对等体被聚集在一起形成基于主题的对等体簇,协作进行Web搜索与信息共享。并采用主题驱动的Web爬行、基于语义概念的文档分类、个性化的链接分析和基于主题划分的P2P搜索等机制来改善PeerBridge的性能。  相似文献   

13.
Although personalized search has been under way for many years and many personalization algorithms have been investigated, it is still unclear whether personalization is consistently effective on different queries for different users and under different search contexts. In this paper, we study this problem and provide some findings. We present a large-scale evaluation framework for personalized search based on query logs and then evaluate five personalized search algorithms (including two click-based ones and three topical-interest-based ones) using 12-day query logs of Windows Live Search. By analyzing the results, we reveal that personalized Web search does not work equally well under various situations. It represents a significant improvement over generic Web search for some queries, while it has little effect and even harms query performance under some situations. We propose click entropy as a simple measurement on whether a query should be personalized. We further propose several features to automatically predict when a query will benefit from a specific personalization algorithm. Experimental results show that using a personalization algorithm for queries selected by our prediction model is better than using it simply for all queries.  相似文献   

14.
传统的基于网页方式的搜索引擎服务不能很好地满足用户个性化的需求,搜索引擎Web API概念的提出较好地解决了这一问题。文中讨论了非商业网站如何使用搜索引擎Web APIs实现网站搜索服务。为避免搜索引擎Web APIs在搜索次数上的限制,给出一种不使用Search APIs而直接通过模拟请求方式得到搜索结果的新方法。  相似文献   

15.
基于Web数据挖掘的个性化搜索引擎研究综述   总被引:2,自引:0,他引:2  
Web数据挖掘是将教据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.论述Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍个性化搜索引擎的一些情况,论述web教据挖掘在个性化搜索引擎中的应用.  相似文献   

16.
电子商务中Web挖掘技术的应用探讨   总被引:2,自引:0,他引:2  
但微  才书训 《微机发展》2006,16(1):207-209
随着电子商务技术的深入发展,商家在与用户交互活动中的信息也迅速膨胀,网上的海量信息为Web挖掘提供了一个广阔的应用领域,使用Web挖掘技术能够发现电子商务过程中的潜在模式。文中针对几种不同特点的电子商务Web挖掘系统,包括智能搜索引擎系统、网站用户访问分析系统、个性化推荐系统等都进行了探讨。  相似文献   

17.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎中的应用.  相似文献   

18.
为了更好地为Web站内检索提供服务,对Web全文检索的关键技术进行了研究,设计并实现了一个用于Web全文检索的中间件。该中间件通过多线程网页爬虫程序来抓取网页;对抓取结果采用基于Bloom-Filter的大规模URL去重算法来进行高效消重;应用所提出的新的基于标签的正文提取方法来进行网页正文提取,实验结果表明该正文提取方法是有效可行的;此外,为了改善用户的搜索体验,该中间件还提供了一些个性化搜索辅助功能。最后,实现了一个完整的博客搜索系统Boso(博搜)来验证中间件的性能,结果说明该中间件是可以投入实际应用的。  相似文献   

19.
基于P2P的个性化Web信息检索   总被引:2,自引:0,他引:2  
为了克服Web搜索引擎在可扩展性、协作性和个性化等方面存在的不足,提出了一种基于Peer to Peer 的全分布、协作式、自组织的个性化Web信息检索,定义了以查询主题为中心进行主题聚类、数据组织和查询路由的用户协作共享策略,设计了协作生成用户兴趣列表向量、对相似语义查询进行主题聚类和更新、基于查询集建立倒排索引以及基于查询主题进行语义路由等算法和机制,以提供人性化、协作式、个性化的搜索。模拟实验表明,原型系统可以加快查询速度,减轻网络负荷,提高搜索的准确率。  相似文献   

20.
Most Web search engines use the content of the Web documents and their link structures to assess the relevance of the document to the user’s query. With the growth of the information available on the web, it becomes difficult for such Web search engines to satisfy the user information need expressed by few keywords. First, personalized information retrieval is a promising way to resolve this problem by modeling the user profile by his general interests and then integrating it in a personalized document ranking model. In this paper, we present a personalized search approach that involves a graph-based representation of the user profile. The user profile refers to the user interest in a specific search session defined as a sequence of related queries. It is built by means of score propagation that allows activating a set of semantically related concepts of reference ontology, namely the ODP. The user profile is maintained across related search activities using a graph-based merging strategy. For the purpose of detecting related search activities, we define a session boundary recognition mechanism based on the Kendall rank correlation measure that tracks changes in the dominant concepts held by the user profile relatively to a new submitted query. Personalization is performed by re-ranking the search results of related queries using the user profile. Our experimental evaluation is carried out using the HARD 2003 TREC collection and showed that our session boundary recognition mechanism based on the Kendall measure provides a significant precision comparatively to other non-ranking based measures like the cosine and the WebJaccard similarity measures. Moreover, results proved that the graph-based search personalization is effective for improving the search accuracy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号