首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
挖掘Web数据   总被引:3,自引:0,他引:3  
李磊  乔智勇 《电子科技》2001,(19):24-26
随着计算机及Internet的迅速发展,Internet已经发展成为一个巨大的信息空间。网络用户通常通过鼠标的点击和搜索引擎来从海量的数据中寻找自己需要的信息。但是由于Web的动态性和异构性,使得用户的搜索效率极低,搜索引擎又存在着搜索范围较小、搜索结果的不准确性和不能提供多媒体搜索服务等缺点。为了克服以上缺点就提出了Web数据挖掘这一概念。异构数据库环境和半结构化的数据结构是Web数据挖掘遇到的新问题。以XML(eXtensible MarkupLanguage)为基础的新一代web环境不仅可以…  相似文献   

2.
分析Web挖掘的关键技术,对数字挖掘中需要解决的技术问题进行了深入的探讨,通过对电子商务领域应用Web挖掘技术,准确获取信息的研究,指出数字挖掘技术将在未来获取有益的信息和知识这一领域中发挥重要的作用。  相似文献   

3.
Web数据挖掘技术与XML   总被引:7,自引:0,他引:7  
王玉珍 《信息技术》2005,29(10):142-144
Web数据挖掘是数据挖掘技术与Web相结合的产物。在深入分析了Web数据挖掘的基本概念、分类、具体的应用及XML的特点后,讨论了如何用XML来解决Web数据挖掘中的相关问题。  相似文献   

4.
Web挖掘是在传统数据挖掘技术的基础上产生的,是从Web上的数据中发现用户的浏览模式或寻找相关的Web页面等。本文首先介绍了Web挖掘的一般知识,然后分析了Web数据挖掘的常用技术,最后讨论了该技术在各领域的应用。  相似文献   

5.
Web数据挖掘技术研究   总被引:5,自引:0,他引:5  
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。  相似文献   

6.
计算机技术与通信技术的发展,互联网的普及,人们可以足不出户,在家即可进行远程学习。数据挖掘技术的运用,使得远程教育更加智能化和个性化。本文从数据挖掘的概念出发,分析了如何将Web技术运用于远程教育。  相似文献   

7.
聚类分析是数据挖掘中一个重要的应用领域,是一种数据划分或分组处理的重要手段和方法。聚类分析算法是Web数据挖掘中的一项关键技术,对于降低储存数据的规模,去除无用的数据信息起到突出的作用,因此它成为了一种广泛使用的数据处理方式。文章介绍了Web数据挖掘的概念、分类以及常用的实现技术,并对Web数据挖掘进行了探讨和分析,最后讨论了聚类分析算法在Web数据挖掘中的应用。  相似文献   

8.
Web数据挖掘研究   总被引:3,自引:0,他引:3  
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。  相似文献   

9.
XML在Web数据挖掘技术中的应用   总被引:3,自引:0,他引:3  
Web数据挖掘已经成为当前被广泛研究的课题.目前很多网站都是用HTML构建的,给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利.本文介绍了一种充分利用XML的优点对HTML描述的网站进行挖掘的一种方法.  相似文献   

10.
随着Internet技术的快速普及和迅猛发展,Internet应用已深入到人类生活的各个角落,如何开发和利用访问Web站点所产生的丰富的信息资源,提高网站的性能,更好地为用户服务、为决策者提供决策支持,成为数据挖掘技术在Web领域研究的热点。本文综述了基于Web的数据挖掘概念、主要技术及分类、流程,说明了Web数据挖掘的应用和研究方向。  相似文献   

11.
随着目前互联网技术的广泛应用,电子商务这种商业模式已经逐渐取代传统的商业模式,电子商务带来的商机对现今社会经济结构的影响也越来越大。电子商务的蓬勃发展和规模壮大,导致WEB服务器中储存了海量的访问信息和各种用户数据。如何从这些海量的数据中挖掘出有价值的信息,就成了现今电子商务网站系统的首要任务。  相似文献   

12.
基于数据挖掘的Web服务器攻击检测   总被引:1,自引:0,他引:1  
随着Web技术的飞速发展,越来越多的单位使用Web方式为用户提供服务,黑客的矛头也逐渐转向了Web服务器。文中研究了如何使用数据挖掘的方法对Web服务器日志进行安全性分析,从而快速发现攻击,并针对Web服务器日志特有的格式,对现有的基于相似系数的异常点检测算法进行了改进,使其符合研究的要求,同时构建了两个安全性分析的数据挖掘模型。通过对现有Web日志记录的挖掘,验证了所述方法的可行性。  相似文献   

13.
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载。在简述Agent技术和Web数据挖掘技术的基础上,结合多Agent和Web数据挖掘,设计出一种新型数据挖掘模型,且进一步阐述了该模型,并做了一些分析测试。结果证明,该方法能有效提高Web数据挖掘的速度、准确率和覆盖率,提高了数据利用率。  相似文献   

14.
基于遗传算法的Web行为挖掘研究   总被引:3,自引:0,他引:3  
针对在Web行为挖掘中,统计学挖掘算法难以发现潜在、先验性的知识,文章提出一种基于遗传算法的Web行为挖掘方法。其通过遗传进化、机器学习的方式,解决了Web行为挖掘中的用户聚类分析和关联分析问题.以适应Web自身,以及Web用户群体行为的发展,试验结果证明了它的可行性和先进性。  相似文献   

15.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

16.
基于Web的文本挖掘研究   总被引:4,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

17.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

18.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

19.
Web日志挖掘的预处理及路径补全算法的研究   总被引:9,自引:0,他引:9  
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法。并给出了路径补全的算法实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号