首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
2.
书籍搜索领域Deep Web数据集成系统   总被引:1,自引:0,他引:1  
随着在线数据库的迅速增长,可以访问的数据库资源大大增多,但它们的信息传统搜索引擎无法获得,它隐藏在网站背后,成为人们快速有效获取信息的障碍.为了获得Deep Web中大量有价值的隐藏信息,需要整合各在线异构数据源,以便在同一领域内比较某一事物的大量相关信息.目前,越来越多的人采取网上买书的消费方式,针对这个消费热点问题,设计了一个书籍搜索领域的Deep Web数据集成系统,提供一个集成的查询接口,使得用户可以方便地进行查找和比对.  相似文献   

3.
4.
Web信息搜索方法(上)   总被引:1,自引:0,他引:1  
  相似文献   

5.
在由多计算机集群构成的数据网格环境下,挖掘网格计算节点的空余资源来支持数据并行型计算(Data Parallel Computing,DPC),提出了一个基于分类、统计机制的数据网格管理模型。根据不同时间的网格资源的空余、各类DPC以及逻辑计算机机群,研究了支持DPC的网格资源管理模型。实验表明,该模型有效地解决了网格环境下数据并行型计算所需的空余资源优化使用问题。  相似文献   

6.
随着在线数据库的迅速增长,可以访问的数据库资源大大增多,但它们的信息传统搜索引擎无法获得,它隐藏在网站背后,成为人们快速有效获取信息的障碍。为了获得Deepweb中大量有价值的隐藏信息,需要整合各在线异构数据源,以便在同一领域内比较某一事物的大量相关信息。目前,越来越多的人采取网上买书的消费方式,针对这个消费热点问题,设计了一个书籍搜索领域的Deep Web数据集成系统,提供一个集成的查询接口,使得用户可以方便地进行查找和比对。  相似文献   

7.
为了提高大规模网络数据搜索的效率,提出了一个基于网格机制的Internet网络数据搜索模型。利用网络跳距离、数据搜索节点密度、计算节点能力和可信性机制以及市场服务代价原则,给出了DSG结构和算法。描述了基于DSG的网络数据搜索过程。  相似文献   

8.
陈庆奎  那丽春 《计算机科学》2006,33(12):110-113
为了提高大规模网络数据搜索的效率,提出了一个基于网格机制的Internet网络数据搜索模型。给出了数据搜索节点、数据搜索服务器、数据搜索区域、数据服务器区域和数据搜索网格(Data Searching Grid-DSG)等一系列定义。利用网络跳距离、数据搜索节点密度、计算节点能力和可信性机制以及市场服务代价原则,给出了DSG结构和构建算法。描述了基于DSG的网络数据搜索过程。该模型的控制结构是基于网格结构的,其具体搜索机制是非结构化的。理论分析表明,该模型具有良好的扩展性和较高的效率。  相似文献   

9.
Web智能搜索多Agent系统结构及相关技术   总被引:7,自引:0,他引:7  
提出了一种多Agent系统结构,由用户界面Agent、过滤查找Agent、反馈更新Agent、操作Agent、搜索Agent、搜索Agent和中心索引库6个部分组成。该多Agent结构适用于Internet上的智能搜索系统,能够完成信息主动搜索、中心索引、信息过滤查找以及用户反馈更新等功能。详细描述了多Agent系统的分工以及相关实现技术的研究。  相似文献   

10.
建立中文维基百科的文档链接和目录结构关系,基于维基关联数据实现Web搜索的主题分类。为查询词扩展语义特征获取和表达查询主题,在维基目录空间上根据目录间的语义关系计算相关度,通过加权累加各目录标签与分类间的相关度评分识别分类标签,最后得出实验结果与分析。结果表明对于提高Web信息检索质量具有重要意义和应用价值。  相似文献   

11.
Abstract. We study Web Caching when the input sequence is a depth first search traversal of some tree. There are at least two good motivations for investigating tree traversal as a search technique on the WWW: First, empirical studies of people browsing and searching the WWW have shown that user access patterns commonly are nearly depth first traversals of some tree. Secondly (as we will show in this paper), the problem of visiting all the pages on some WWW site using anchor clicks (clicks on links) and back button clicks—by far the two most common user actions—reduces to the problem of how best to cache a tree traversal sequence (up to constant factors). We show that for tree traversal sequences the optimal offline strategy can be computed efficiently. In the bit model, where the access time of a page is proportional to its size, we show that the online algorithm LRU is (1 + 1/ɛ) -competitive against an adversary with unbounded cache as long as LRU has a cache of size at least (1+ ɛ) times the size of the largest item in the input sequence. In the general model, where pages have arbitrary access times and sizes, we show that in order to be constant competitive, any online algorithm needs a cache large enough to store Ω(log n) pages; here n is the number of distinct pages in the input sequence. We provide a matching upper bound by showing that the online algorithm Landlord is constant competitive against an adversary with an unbounded cache if Landlord has a cache large enough to store the Ω(log n) largest pages. This is further theoretical evidence that Landlord is the ``right' algorithm for Web Caching.  相似文献   

12.
文中首先讨论了书面汉语切分研究的问题,然后从一般性研究出发,提出了全切分算法中可能的并发检索。并针对全切分分词算法进行了研究,给出了全切分分词方法算法中的并发检索模型。希望本文对于全切分算法中并发检索模型的讨论,对深入研究书面汉语全切分分词的问题和实现具有实际意义。  相似文献   

13.
管理信息系统中最具挑战性的部分是数据搜索部分,结合自行开发的学生信息管理系统,尝试使用微软为下一代网页技术所准备的套件——ASP.NET ADO.NET SQL Senrer 2000来实现所需的网页数据检索功能,实现了数据的分类与二次检索。  相似文献   

14.
海量数据搜索   总被引:3,自引:0,他引:3  
田海生 《微机发展》2005,15(10):44-45,48
目前,信息化建设存在的问题是:数据信息利用不充分,大量的数据仅以物理状态被简单地存储着。同时由于无法实现海量数据的高效搜索,使得这些数据无法为企业的发展提供决策支持。如何突破海量数据存储和搜索的瓶颈,让数据为企业决策提供支持已经成为信息化建设的重点。通过数据“变革”使得数据能够更合理的存储、更高效的搜索,智能地使用企业的数据财产来制定出更好的商务决策,以提高企业的竞争力。  相似文献   

15.
介绍了PageRank和HITS两种最常见的算法,对基于链接结构分析的Web搜索算法的研究进展进行了综述,主要包括:介绍了独立于查询的各种改进算法以及基于查询主题的有关算法,并分析上述算法的优缺点及其改进策略或方法,以及Web搜索算法的关键技术和应用,最后是关于Web搜索算法存在的问题和研究展望。  相似文献   

16.
徐文杰  陈庆奎 《计算机应用》2009,29(4):1117-1119
介绍了并行Web爬虫系统的总体结构,引入了增量更新爬虫策略,在提高Web海量数据更新效率的同时,考虑到机群中各个爬虫的能力不一,为了使机群中爬虫的能力得到充分应用,又提出了向量度量技术,解决了抓取任务和爬虫能力匹配的问题。对抓取任务向量、爬虫向量进行了定义,并在此基础上给出了相关的并行算法。实践表明,系统具有良好的分配适应性,并可以在此基础上渐增式地提高网页库新鲜度。  相似文献   

17.
并行技术在数据仓库中的应用   总被引:2,自引:0,他引:2  
由于庞大的细节数据的存储 ,使得数据仓库向TB级发展 ,加之许多复杂处理 ,所以使并行技术的实现成为必然。在分析了并行技术的基础上 ,认为采用基于无共享结构的MPP体系结构最适合于数据仓库的现状和发展趋势 ,并指出了利用并行技术设计大型数据仓库应注意的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号