首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
张敏 《信息技术》2006,30(6):143-145
Web上信息的不断增长对搜索引擎提出了更高的要求,个性化信息检索成为目前研究的一个热点。现提出了一个基于Agent的个性化信息检索系统模型PILLS,主要分析了系统的组成及各组成部分的工作原理。理论上,无论是查准率还是查全率,PILLS系统的查询结果优于一般搜索引擎的查询结果。  相似文献   

2.
韦鲁玉  丁华福 《信息技术》2007,31(1):109-111
针对目前信息检索系统存在的不足,首先,在系统地介绍信息检索研究现状的基础上对个性化信息检索的发展、工作原理和现状进行了简要综述,并对Agent技术做了介绍.然后,从现有问题入手,开发设计一个了基于Agent的个性化智能信息检索系统模型.对基于Agent的个性化信息检索系统的基本结构、方法及相关技术进行了研究.该模型由用户信息检索个性Agent、信息搜索Agent和信息过滤Agent三个模块构成,分别对三个模块中的关键技术进行研究.结果表明,该平台减少搜索范围,加快搜索速度.  相似文献   

3.
基于Agent的智能个性化信息检索系统模型研究   总被引:9,自引:0,他引:9  
文章通过描述目前已有搜索引擎弊端,提出了一种个性化的信息检索系统模型.通过智能Agentg与移动Agent的结合为用户提供个性化的服务,详细分析了模型的工作原理,并描述了各功能模块的实现方法,部分解决了信息检索中兼顾查全与查精的问题.文章最后指出了项目未来的研究方向.  相似文献   

4.
文章介绍一个基于Web的信息获取系统的框架与实现,给出了系统总体结构,分析了信息采集子系统、原始资料处理子系统、系统配置子系统和推送,检索子系统。实践证明,本Web信息获取系统能够对Internet上用户提交的请求进行自动采集、自动分类,对后继的信息处理提供了充分的支持。  相似文献   

5.
为了适应各种用户需求,为用户提供全面的信息,网页往往都包容万象具有丰富庞大的信息量,然而,每个用户只关心自己感兴趣的信息.本文把网页信息和用户偏好看成模糊本体,通过求这两个模糊本体的交集得到用户感兴趣的网页信息,为用户提供高效、便捷的个性化服务.  相似文献   

6.
针时现有的个性化信息检索系统存在的问题,提出一种新的基于用户兴趣的个性化Web信息检索方法,采用自动隐式学习方式来建立和更新用户兴趣库,采用本体技术来进行语义扩展,从而提高Web信息检索的查准率和查全率.文中给出了个性化Web信息检索系统的体系结构和个性化机制的关键技术及相关算法,全面描述了基于用户兴趣的个性化处理过程.该方法能更好地满足用户的需求,为其提供个性化服务.  相似文献   

7.
搜索引擎系统中个性化机制的研究   总被引:3,自引:0,他引:3  
随着Internet的飞速发展,搜索引擎系统越来越成为信息检索领域中的研究热点,文章针对传统搜索引擎系统的缺点.设计了一种新型个性化搜索引擎系统的体系架构,能够针对不同用户提供不同的检索结果,并给出了系统中个性化机制的相关算法。模拟实验表明,该结构和算法能够有效地提高检索结果的准确度。并且具有良好的可适应性。  相似文献   

8.
基于RFID技术的图书馆信息采集系统解决了如今国内图书管理工作中主要应用条形码识别技术的弊端,该系统具有独立性、可联网性、稳定性等特点。文章对基于RFID(射频识别技术)的图书馆智能管理系统的内部系统组成和技术设计进行了研究。  相似文献   

9.
视频信息具有独特的信号特征,在数字信号处理时,采集逻辑控制设计需要考虑的因素很多.该文在论述采集逻辑控制设计的一般原则的基础上,提出了基于CPLD技术的设计方法.  相似文献   

10.
以高性能的S3C44BOX芯片为处理器核心,结合嵌入式实时操作系统uC/OS-Ⅱ,设计并实现了实时性强、结构优化的农田信息采集系统;构建了嵌入式系统软硬件平台,详细阐述了应用软件的任务设计、优先级安排和各任务之间的关联性,经过理论和实验证明,该农田信息采集系统性能优良,可靠性高。  相似文献   

11.
分布式Web Crawler的研究:结构、算法和策略   总被引:12,自引:0,他引:12       下载免费PDF全文
叶允明  于水  马范援  宋晖  张岭 《电子学报》2002,30(Z1):2008-2011
本文介绍了一个大型分布式Web Crawler系统--Igloo 1.2版.它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.  相似文献   

12.
分析了web2.0网络的网络爬虫面临的新挑战,对目前学术界出现的多种实现方案和策略进行了全面的综述,提出了AJAX爬虫的设计并加以实现,最后进行了实验验证,验证了这种AJAXCrawler能够很好地获取AJAX的动态页面,并与普通的爬虫在下载速度方面进行了对比。  相似文献   

13.
基于BP神经网络的Web页面分类算法   总被引:3,自引:0,他引:3  
提出了一种基于BP神经网络的Web页面分类算法。在搜索引擎的结构中提取页面标题、内容标题和内容摘要来表示页面,采用向量空间模型计算分类组合与页面组合的相关性对页面进行矢量化,将训练后的BP神经网络用于对Web页面进行分类。实验结果表明,该分类算法有一定的实用价值。  相似文献   

14.
主题搜索引擎中专业网页索引集构造算法的研究   总被引:2,自引:2,他引:0  
针对特定主题的搜索引擎构建问题,给出了一种主题搜索引擎的体系结构,并在此基础上,提出了面向主题的专业网页索引集构造算法.模拟实验表明,以该算法为基础的主题搜索引擎能使用户搜索到该主题的权威页和中心页,可以有效地提高搜索引擎的查准率.  相似文献   

15.
16.
网络爬虫是互联网运行服务的重要组成部分,并为整个互联网、企业内部网和大型门户网站提供搜索和索引.为解决现有爬虫方法在效率方面的问题,本文介绍了Nutch分布式爬虫工作流程及机制,通过分析Hadoop下的Nutch网络爬虫,在Nutch分布式爬虫的参数方面、Hadoop的I/O模型和Nutch分布式爬虫小文件问题三个方面做了相关优化.实验结果表明,优化后的网络爬虫能更有效的爬取网络资源,能在较大程度上提升网络爬虫效率.  相似文献   

17.
文章详细介绍了网络爬虫的原理,对需设计的网络爬虫进行深入的研究,包括运用的编程语言,以解析何网页为基础,爬虫运用何算法爬行整个网络,以高效率、高准确度地抓取与部队相关的信息,并保存在数据库中。  相似文献   

18.
网络爬虫技术经过多年的发展,传统的应用和分析相对成熟,但是随着大数据、移动互联网时代的到来,在大规模、海量异构、隐蔽信息的实时快速采集和获取方面,仍然存在诸多的困难.本文对网络爬虫的技术原理进行分析,开发了基于NCrawler的网络爬虫软件并进行应用,可依据关键词灵活在网页深度、广度搜索两种搜索策略中调整权重,具有广泛的扩展能力,支持各种类型及格式资源的爬取.最后本文对网络爬虫技术的应用领域和趋势进行了分析和展望.  相似文献   

19.
传统黄页检索采用基于关键词的检索,而缺乏对语义的表示、处理等能力,这就导致了目前黄页检索质量低下的缺陷。提出使用语义Web技术和Web服务结合起来的语义Web服务解决该问题的思路,构造了语义级别的黄页检索框架,他能够提高检索的查全率和查准率。同时介绍了黄页检索现有的一些应用系统,并分析下一步研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号