首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
XML在Web数据挖掘技术中的应用   总被引:3,自引:0,他引:3  
Web数据挖掘已经成为当前被广泛研究的课题.目前很多网站都是用HTML构建的,给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利.本文介绍了一种充分利用XML的优点对HTML描述的网站进行挖掘的一种方法.  相似文献   

2.
陈尧妃  倪应华 《现代电子技术》2007,30(2):133-134,137
针对Web挖掘中异构数据源和半结构化的特点,提出基于XML个性化Web挖掘框架模型实现用户兴趣数据的挖掘。分析模型的工作流程,重点讨论实现该模型的关键技术:XML文档统一模型、Web内容预处理模块和Web内容挖掘模块。  相似文献   

3.
随着互联网的广泛使用,Web的数据挖掘技术成为现阶段数据挖掘技术研究的重点,但由于其数据挖掘控制的复杂,对人们的数据挖掘和使用带来了困难。而XML数据挖掘的出现弥补了Web数据挖掘的缺陷,为其带来了方便。  相似文献   

4.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

5.
随着Web网页信息容量的不断增大,在Web网页搜索信息的时间越来越长,为了加快用户提取数据信息的快速性和有效性,在Web信息数据库中融入XML数据技术,并采用JTidy和Dom4j等开源工具对XML数据进行解析,加快各节点之间的信息查询。本文针对Web信息数据库的构建问题,在数据库的建立过程中融入XML数据,并介绍Web数据的挖掘方法、挖掘思路与挖掘框架,促进XML在Web信息数据库中的应用。  相似文献   

6.
本文主要讨论Web数据挖掘技术电子商务领域的应用。介绍了Web挖掘的的基本内容和电子商务中常用的Web数据挖掘技术,分析了Web访问信息挖掘在电子商务中的几点具体的应用。  相似文献   

7.
聚类分析是数据挖掘中一个重要的应用领域,是一种数据划分或分组处理的重要手段和方法。聚类分析算法是Web数据挖掘中的一项关键技术,对于降低储存数据的规模,去除无用的数据信息起到突出的作用,因此它成为了一种广泛使用的数据处理方式。文章介绍了Web数据挖掘的概念、分类以及常用的实现技术,并对Web数据挖掘进行了探讨和分析,最后讨论了聚类分析算法在Web数据挖掘中的应用。  相似文献   

8.
Web数据挖掘研究   总被引:3,自引:0,他引:3  
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。  相似文献   

9.
电子商务现在已经开始普遍存在于现代商务活动之中,而电子商务的蓬勃发展也为不少企业产生了新的发展机遇,在机遇产生的同时也产生了大量的数据业务。面对这些新产生的庞大数据量,Web数据挖掘技术开始展现出独有的作用。Web数据挖掘技术可以很好地帮助企业在电子商务活动中挖掘、利用和管理到了全面的海量数据,使得这些数据不为人所知的价值被挖掘出来,帮助企业决策人更好的制定计划和各项业务的指标。基于此,本文主要从电子商务的概念、Web数据挖掘技术、Web数据挖掘过程、电子商务系统中的Web数据挖掘技术和Web数据挖掘技术在电子商务中的应用五个方面进行了叙述,希望以此来提高Web数据挖掘技术在电子商务中的运用程度。  相似文献   

10.
Web挖掘是在传统数据挖掘技术的基础上产生的,是从Web上的数据中发现用户的浏览模式或寻找相关的Web页面等。本文首先介绍了Web挖掘的一般知识,然后分析了Web数据挖掘的常用技术,最后讨论了该技术在各领域的应用。  相似文献   

11.
Web数据挖掘技术研究   总被引:5,自引:0,他引:5  
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。  相似文献   

12.
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载。在简述Agent技术和Web数据挖掘技术的基础上,结合多Agent和Web数据挖掘,设计出一种新型数据挖掘模型,且进一步阐述了该模型,并做了一些分析测试。结果证明,该方法能有效提高Web数据挖掘的速度、准确率和覆盖率,提高了数据利用率。  相似文献   

13.
针对互联网的数据挖掘在“棱镜”计划中扮演着至关重要的角色.文中首先对数据挖掘的基本技术原理进行了分析,包括关联分析和机器学习的常用算法.然后介绍了互联网信息检索和挖掘的主要技术.接下来提出了一种基于开源云计算平台的互联网大数据挖掘系统架构.最后,对互联网大数据挖掘的发展指出了方向.  相似文献   

14.
在云计算环境下,Web数据挖掘技术得到了快速发展。由于云计算的应用,Web数据挖掘体系已体现出新的特点。分析云计算环境下Web数据挖掘技术的特点,可以明确应用要点,可以实现云计算在数据存储中的突破,实现存储的能力与安全性的提高。从海量数据中高效挖掘有价值的资源,属于信息技术要解决的关键问题。云计算技术支持下的数据挖掘实现了资源的优化配置,体现出实用性、虚拟性的特点,可以保证数据挖掘的高效、精准。因此,有必要构建基于云计算的数据挖掘模式,保证数据挖掘具有更高的精准度,并实现挖掘成本的降低。  相似文献   

15.
基于关联规则的Web挖掘技术研究   总被引:1,自引:1,他引:0  
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

16.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

17.
数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。  相似文献   

18.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号