首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
研究并实现了一个面向领域的Web挖掘系统WMS,能有效地帮助用户挖掘Web上的信息和知识,用户可以通过提交Web页面、文本文档、URLs或关键词,向系统表达自己希望获得的信息主题,系统自动学习用户对特定领域的兴趣.并依据用户对系统采集文档的反馈评估,不断自适应地调整用户兴趣模型.WMS依据用户兴趣模型,利用智能Agents,对用户感兴趣的有关信息进行搜索和过滤,并对主要相关Web站点的信息更新进行监测,利用人工神经网络和智能Agents技术,WMS对所积累的文档库进行信息和知识挖掘,并自动将新信息推荐给用户.  相似文献   

2.
Web社区是组织之间实现信息交流、共享和讨论的环境。一个Web社区一般涉及几十到几百个组织,怎样快速的从组成Web社区的组织中获取信息是一个很重要的问题。论文分析了Web社区搜索的特点,介绍了Web搜索引擎的基本原理。基于Web抓取器,向量空间模型,结合相关性排序等技术实现了一个Web社区搜索引擎——ChinalabSearch,详细阐述了系统的体系结构。根据对系统的性能评估,系统满足Web社区的搜索要求,可以提高在社区内查找信息的效率,为组织间的合作提供方便。  相似文献   

3.
基于P2P的个性化Web搜索系统的设计与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
针对中心化的Web信息搜索系统在覆盖率、及时性、个性化、可扩展性等方面存在的问题,提出了一种基于Peer-to-Peer(P2P)的可扩展、个性化的Web搜索系统PeerBridge。PeerBridge基于分布式哈希表组织大量的网络结点形成有组织的P2P覆盖网络,每个对等体作为一个主题搜索引擎,根据用户兴趣从Web中搜索特定主题相关的信息,而具有相似主题的对等体被聚集在一起形成基于主题的对等体簇,协作进行Web搜索与信息共享。并采用主题驱动的Web爬行、基于语义概念的文档分类、个性化的链接分析和基于主题划分的P2P搜索等机制来改善PeerBridge的性能。  相似文献   

4.
一个Web站点自动生成系统   总被引:1,自引:0,他引:1  
1 引言目前,Internet/Intranet正在飞速发展,而Web是Internet/Intranet上一种最有效的信息交流方式,用户可以通过访问Web站点来获得信息、服务,并反馈意见。因此,对于普遍的政府部门、企业、学校等单位来说,迫切需求建立Web站点,也需要一种能快速生成与维护Web站点的工具。然而,现存的FrontPage等HTML页面编写工具,自动化、智能化程度不高,操作复杂烦琐,要求用户具有较高的计算机技能,普通用户难于掌握。因此,给出一个Web站点自动生成工具,帮助企事业单位方便、快速地建立起Web站点是非常有意义的。  相似文献   

5.
Web目前是一个巨大的、分布广泛的、全球性的信息服务中心,Web挖掘不仅仅是数据挖掘算法在Web数据上的应用,同传统的数据库数据相比,Web数据具有其特殊性,其特点就是数据没有严格的结构模式、含有不同格式的数据(文本、声音、图像等)、面向显示的HTML文本无法区分数据类型,并且存在大量的冗余和噪声,同时Web是一个动态性极强的信息源,所以面向Web的数据挖掘研究极具挑战性。本文对Web挖掘的特征进行了分析与研究。  相似文献   

6.
传统的主题抽取方法单纯依靠分析网页内容的来自动获取网页主题,其分析结果并不十分精确.在WWW上,网页之间通过超链接来互相联系,而链接关系紧密的网页趋向于属于同一主题、基于这一思想,本文提出了一种利用Web链接结构信息来对主题抽取结果进行求精的方法,其通过所链接网页对本网页的影响来修正本网页的主题权值.本文还通过一个实际应用例子,分析了这一方法的特点。  相似文献   

7.
基于重复模式的自动Web信息抽取   总被引:3,自引:2,他引:1       下载免费PDF全文
互联网上存在很多在线购物网站,抽取这类网站页面里的商品信息可以为电子商务、Web查询提供增值服务。该文针对这类网站提出一种自动的Web信息抽取方法,通过检测网页中的重复模式以及分析主题内容的特征获取网页的主题内容,该方法在抽取过程中不需要人工干预。对10个在线购物网站进行了测试,实验结果表明提出的方法是有效的。  相似文献   

8.
Deep Web爬虫爬行策略研究   总被引:6,自引:0,他引:6  
如今Web上越来越多的信息可以通过查询接口来获得,为了获取某Deep Web站点的页面用户不得不键入一系列的关键词集。由于没有直接指向Deep Web页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,近来研究表明Deep Web站点提供的高质量的信息对许多用户来说是非常有价值。这里研究了怎样建立起一个有效的Deep Web爬虫,它可以自动发现和下载Deep Web页面。由于Deep Web惟一“入口点”是查询接口,Deep Web爬虫设计面对的主要挑战是怎样对查询接口自动产生有意义的查询。这里提出一种针对查询接口查询自动产生问题的理论框架。通过在实际Deep Web站点上的实验证明了此方法是非常有效的。  相似文献   

9.
Web服务发现是Web服务系统架构的重要部分,现有的主流Web服务发现方法是采用基于UDDI框架的服务匹配,但由于UDDI注册中心只能提供基于关键字的查询,并且缺乏对语义信息的支持,造成服务的查准率查全率得不到保证.针对目前Web服务发现技术存在的不足,引入了语义技术,并设计了一个基于语义的服务发现原型,来验证提出的基于语义的服务发现方法的可行性.  相似文献   

10.
Web信息检索服务系统与搜索引擎   总被引:6,自引:2,他引:6  
引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某种次序排列组织,使用户可以通过索引进行查阅。  相似文献   

11.
Deep Web数据集成研究综述   总被引:24,自引:1,他引:24  
刘伟  孟小峰  孟卫一 《计算机学报》2007,30(9):1475-1489
随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件十分挑战性的工作.Deep Web数据集成至今仍然是一个新兴的研究领域,其中包含有若干需要解决的问题.总体来看,在该领域已经开展了大量的研究工作,但各个方面发展并不均衡.文中提出了一个Deep Web数据集成的系统架构,依据这个系统架构对Deep Web数据集成领域中若干关键研究问题的现状进行了回顾总结,并对未来的研究发展方向作了较为深入的探讨分析.  相似文献   

12.
Web社区管理研究综述   总被引:1,自引:0,他引:1  
随着互联网不断增长,对Web社区这种新的社会交流应用形式进行研究具有重要的意义,并引起人们广泛关注,但其理论研究仍然落后于实践。通过讨论Web社区的定义,对比分析国内外的研究现状,对Web社区管理的研究主要集中在建模、社区发现、用户交互和推荐等领域,其中社区发现和推荐研究充分利用了Web社区具有关系和协同的特点。总结相关研究成果,并从服务管理、声誉管理和社会搜索三个方面对未来的研究趋势进行了展望。  相似文献   

13.
一种从马尔可夫聚类簇发现潜在WEB社区特征的方法   总被引:1,自引:0,他引:1  
杨楠  林松祥  高强  孟小峰 《计算机学报》2007,30(7):1086-1093
在分析了目前一些典型的社区发现算法的基础上,通过对无主题条件下的隐含社区发现算法的研究,提出将基于流的社区特征和马尔可夫图形聚类算法(MCL)的簇结合起来寻找Web隐含社区的方法.将镜像或近似镜像页面的删除放在图形聚类之后,大大减少了比较的代价.然后,在聚类簇的基础上,使用判定每个簇内元素的筛选算法产生可能的社区候选集合.实验表明,该方法是可行的,可以发现许多存在的社区.  相似文献   

14.
语义Web服务系统模型研究   总被引:1,自引:0,他引:1  
目前的Web服务过程中需要大量的手动操作,这难以满足现今动态的、组合的业务处理要求。为了有效的解决上述问题,我们提出了语义Web服务系统模型,该模型使用了源码注解、服务模板和约束分析等先进技术,这样不但提高了Web服务操作的自动化程度,而且增强了Web服务处理的精准度和效能,同时将以往能否找到合适Web服务的问题提升为怎样选择最佳Web服务的问题。  相似文献   

15.
The objective of this paper is to discuss how to sustain the growth of Web services through the use of communities. A community aims at gathering Web services with the same functionality independently of their origins, locations, and functioning. To make Web services more responsive to the environment in which they run and to be more flexible when managing communities, Web services are associated with software agents enhanced with argumentation capacities. This type of agents persuade and negotiate with other peers for the sake of letting their respective Web services reach their goals in an efficient way. Associating Web services with this type of agents allows them to select good communities and allow the communities to host the good Web services and to select the best ones for composite scenarios. Furthermore, this provides satisfactory solutions for three open problems: starvation (Web services refuse all the possibilities of joining communities), competition-free (Web services accept joining any community without being selective), and unfairness (always the same Web services members of a community are selected out of many others to participate in composite scenarios). In addition, the paper presents a formal and computational persuasive and negotiation protocol to manage the attraction and retainment of Web services in the communities and their identification for composite services.  相似文献   

16.
随着网络的快速发展与普及,大量有用的网络信息给人们生活、工作和学习带来了便利。与此同时网络中还存在着许多无用的信息,如何从浩如烟海的数据海洋中,快速准确的查找数据,成为了当今社会不可忽视的问题。Web数据挖掘技术,正是解决这一问题的关键。该文从Web数据挖掘技术的角度,阐述Web数据挖掘的概念、分类、过程及常见的Web数据挖掘算法。  相似文献   

17.
A common perception is that there are two competing visions for the future evolution of the Web: the Semantic Web and Web 2.0. A closer look, though, reveals that the core technologies and concerns of these two approaches are complementary and that each field can and must draw from the other’s strengths. We believe that future Web applications will retain the Web 2.0 focus on community and usability, while drawing on Semantic Web infrastructure to facilitate mashup-like information sharing. However, there are several open issues that must be addressed before such applications can become commonplace. In this paper, we outline a semantic weblogs scenario that illustrates the potential for combining Web 2.0 and Semantic Web technologies, while highlighting the unresolved issues that impede its realization. Nevertheless, we believe that the scenario can be realized in the short-term. We point to recent progress made in resolving each of the issues as well as future research directions for each of the communities.  相似文献   

18.
Web使用模式挖掘技术在网站营销中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
王玉珍 《计算机工程》2006,32(18):55-57
Web使用模式挖掘是Web数据挖掘的重要内容之一,其应用领域非常广泛。将Web数据挖掘技术应用于电子商务网站的营销中,可发现许多有用的信息,有效地使用这些信息可促进电子商务网站的发展。  相似文献   

19.
Web服务在信用信息工程中的应用   总被引:2,自引:2,他引:0  
目前的社会信用信息工程中,许多的政府部门都建立了自己的信用信息数据库,但在政府各级部门数据库之间进行数据交流和共享存在着许多的问题,在许多地方,数据共享还是一片空白。Web服务技术是应用程序通过内联网或者因特网发布和利用软件服务的一种标准机制。利用WEB服务可以方便地实现不同系统之间的数据交换和集成。该文提出利用web服务技术来解决信用信息工程中的信息数据共享问题。并在此基础上提出利用WEB服务工作流技术将信用评估整合到电子商务过程,以实现可信用电子商务  相似文献   

20.
Heliophysics is the study of highly energetic events that originate on the Sun and propagate through the solar system. Such events can cause critical and possibly fatal disruption of the electromagnetic systems on spacecraft and on ground-based structures such as electric power grids, so there is a clear need to understand the events in their totality as they propagate through space and time. The e-Science challenge posed is that the data was gathered by many observatories and communities that have hitherto not needed to work together. Firstly, this involves the problem of helping users to more easily find and understand the relevance of data, especially data from outside their domain. Secondly, it involves solving challenges of data integration. We describe the design of the HELIO infrastructure, based on the use of Web services linked together by workflows and accessible via portal-based user interfaces. We also discuss current progress in the implementation of this infrastructure and the feedback from the user community.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号