首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
分析了Web链接结构及其应用,对链接分析在Web信息搜索、万维网潜在的社团发现及万维网建模等方面的研究进行了综述,并深入研究了各个链接分析算法的优缺点及性能,作出了分类评价,为以后的算法改进提供了理论基础。  相似文献   

2.
传统的主题抽取方法单纯依靠分析网页内容的来自动获取网页主题,其分析结果并不十分精确.在WWW上,网页之间通过超链接来互相联系,而链接关系紧密的网页趋向于属于同一主题、基于这一思想,本文提出了一种利用Web链接结构信息来对主题抽取结果进行求精的方法,其通过所链接网页对本网页的影响来修正本网页的主题权值.本文还通过一个实际应用例子,分析了这一方法的特点。  相似文献   

3.
基于聚类的Web链接抽取   总被引:1,自引:0,他引:1  
互联网是通过超链连接起来的网页,为人们的日常和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域起着越来越重要的作用。然而链接中存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种基于聚类的与网站模版无关的自动WEB链接抽取方法。试验结果表明该算法具有实用的价值。  相似文献   

4.
郭阳  刘展威  赵正旭 《计算机工程》2011,37(23):105-106,109
对于凭借网页间链接结构所构成的超大规模复杂网络,万维网的链接结构并不符合传统的随机网络模型。为此,通过对万维网真实链接数据的提取及分析,计算并对比节点的度分布、平均路径长度及集群系数等相关网络指标。分析结果表明,万维网具有小世界效应,整个网络的平均路径长度约为15跳,具有相似主题的网页组成若干个集群,进而构成无标度网络。  相似文献   

5.
因特网的迅速发展对万维网信息的查找与发现提出了巨大的挑战。对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页,为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究思路和方法。该文针对聚焦爬虫这一研究热点,对现今聚焦爬虫的爬行方法(主要是网页分析算法和网页搜索策略)做了深入分析和对比,提出了一种改进的聚焦爬行算法。这种基于类间规则的聚焦爬行方法借助baseline聚焦爬虫的架构,应用朴素的贝叶斯分类器并利用主题团间链接的统计关系构造规则找到在一定链接距离内的"未来回报"页面,并通过实验对该算法的性能进行分析、评价,证明其对聚焦爬虫的爬行收获率和覆盖率有很好的改善。  相似文献   

6.
万维网从网页到站点所形成的链接结构构成一个规模宏大的复杂网络.尽管其发展包含许多随机因素,传统的随机网络模型并不适合描述其结构,实证研究表明其结构呈现一种无尺度网络特征,即海量网络信息资源是由少量的以信息集散节点为核心的网络链接方式构成的.万维网中同时具有“小世界”特征,具有相似主题的资源构成一系列小集群,进而组成无尺度网络.提出了一种万维网的信息传播与访问过程的主动服务与信息推荐体系结构,该结构为资源优化传播以及个性化虚拟社区服务的主动服务网格奠定了理论基础.  相似文献   

7.
一种利用链接信息检索关键资源的算法   总被引:2,自引:0,他引:2  
随着互联网的发展,基于Web的信息处理技术越来越受到人们的重视,也是当前研究的前沿课题。本文探讨的是如何在现有检索技术的基础上,利用Web网页的链接信息,自动地得到更高质量的检索结果——关键资源。本文提出一种同时利用Web网页的结构和内容信息以及链接信息的新方法:先结合网页的结构信息和内容评分得到网页的文档评分,然后基于网页出链的文档评分计算网页的链接评分。实验表明,本文的方法减少了无用链接的干扰,比单纯利用链接信息的效果好得多。  相似文献   

8.
Web链接结构信息研究综述   总被引:4,自引:1,他引:4  
万维网(World Wide Web)是由大量的网页组成的,网页之间由超链接(HyperLink)相互连接。在传统上,人们对网络信息的分析和获取是依靠对网页内容的分析和处理来进行的。例如,传统的网络搜索引擎对网页上文本信息进行分析、索引,并将处理后的信息存储在数据库中,然后根据用户查询输入进行分析,获得查询结果。  相似文献   

9.
本文对网页链接结构以及主题信息检索系统进行分析,将链接分析方法应用到主题信息检索系统,概述了链接分析方法在主题信息检索系统搜索策略和检索结果排序中的应用以及运用链接分析进行主题页面相关度分析的方法和策略,运用链接分析衡量主题页面权重,使用建立链接分析主题词典的方法对主题信息检索系统进行改进以便于提高定向信息搜索采集效率。  相似文献   

10.
《软件世界》2008,(10):5-5
万维网自九十年代中兴旺起来至今已经有超过150亿个网页了,它改变了我们生活的方方面面,我们许多人工作都离不开它。然而,Web不仅仅是大量网页的集合,其中涌现出的大量突现特性(emergentproperties)正在改变着我们的社会。可是,很少有研究者研究这些突现特性是如何产生的、我们如何去利用它们、有什么新的现象会出现以及它们对人类有何意义等等。万维网科学(Webscience)正是致力于解决这些问题的一门新学科。  相似文献   

11.
Web智能研究现状与发展趋势   总被引:10,自引:0,他引:10  
Web智能是近年出现的一个崭新的研究方向,它是人工智能和高级信息技术在新的Web和Internet环境下相互融合的产物.首先从总体上讨论了Web智能的概念、研究内容和功能技术框架,然后分别就Web智能的几个核心方面的研究现状进行了综述,主要包括语义Web与ontology,Web Agent和Web挖掘等,并进一步给出了它们的研究重点和发展方向,最后是关于Web智能的研究展望和面临的挑战,指出智慧Web是Web智能研究的目标和中长期发展方向.  相似文献   

12.
介绍一种基于Web挖掘和URL相结合的Web过滤方法,利用Web挖掘实现基于内容的离线Web分类,有效地解决了单纯基于关键词过滤和人工维护URL过滤系统的缺陷。实验结果表明,该系统对于网页类别的识别达到了可以接受的程度,具有良好的实用价值。  相似文献   

13.
Web个性化技术研究综述   总被引:1,自引:0,他引:1  
Web个性化是近年出现的一个重要研究方向,它是Web使用挖掘和信息技术在新的Web和Internet环境下相互融合的产物.首先讨论了Web使用挖掘及个性化的概念、研究内容和核心技术,然后对Web使用挖掘的关键技术进行了综述,包括数据采集与预处理、模式发现、语义Web与个性化等,并给出了它们的研究重点和发展方向,最后是个性化系统的研究展望和面临的挑战.  相似文献   

14.
一个网页在线发布系统的设计与实现   总被引:7,自引:1,他引:7  
论述了网站建设对网页发布系统的需求 ,并从系统设计思想、系统实现等方面详细介绍了一个网页在线自动发布系统的实现 ,该系统已在实际中得到了应用  相似文献   

15.
在对目前Web存在的主要问题进行了分析的基础上,介绍语义网,并针对语义网优势和特征进行了论述,展望了语义网的发展前景。  相似文献   

16.
Web应用开发方法研究   总被引:3,自引:0,他引:3  
目前,Web系统开发缺乏严格和系统的方法,大多数应用开发和管理实践在很大程度上依赖于开发人员个人的知识和经验,造成的后果是所开发的Web系统大多是低质量的产品。而传统的软件工程方法不能适应Web设计的要求,为此人们研究提出了众多的Web开发方法。这些研究旨在提供全面支持Web应用开发生命周期的模型和方法,但由于这些方法本身存在的局限性及其它方面的原因,还没有得到广泛的应用。论文首先讨论了成熟的Web开发方法应该具有什么样的特性和功能,然后分析了现有Web开发方法各自的特点,最后总结了这些方法所存在的问题和今后的研究重点。  相似文献   

17.
Web2.0技术浅析   总被引:4,自引:0,他引:4  
张泽清 《福建电脑》2009,25(4):47-47
本文首先简单介绍了Web2.0的概念及其3个主要理论基础,然后详细介绍了Web2.0中的主要技术及其应用,最后展望了Web2.0下一代技术——语义网。  相似文献   

18.
Web挖掘及其应用研究   总被引:7,自引:0,他引:7  
Web挖掘就是利用数据挖掘技术,从Web文档和Web活动中提取感兴趣的,潜在的有用模式和隐藏的信息,本文详细阐述了Web的特点,Web挖掘的分类及应用。  相似文献   

19.
ABSTRACT

A selective, annotated bibliography of books, journal articles, and electronic resources relating to Web site design aimed specifically at beginning library Web Managers.  相似文献   

20.
刘先熙 《数字社区&智能家居》2009,5(7):5086-5087,5095
随着Intemet/Web技术的快速普及和迅猛发展,各种信息可以以非常低的成本在网络上获得。如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。Web数据挖掘旨在发现隐藏在Web数据中潜在的有用知识、提供决策支持,已经成为数据挖掘领域中新兴的研究热点。该文主要从Web内容挖掘、Web结构挖掘和Web使用挖掘三个方面阐述Web数据挖掘的基本知识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号