首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
Web挖掘是一项综合技术,涉及Web、数据挖掘、计算机语言学、信息学等多个领域。Web数据挖掘是数据挖掘领域的一个新的研究方向。本文主要介绍了数据挖掘技术在电子商务网站方面的应用,提出了构建一个面向数据挖掘的电子商务网站体系架构。  相似文献   

2.
在网络技术高速发展的今天,Web技术得到普及,通过对Web的数据挖掘,用户能够获取到所需要的数据信息、知识,同时能够对用户的访问行为、内容进行深入分析.Web日志挖掘是数据挖掘中的重点内容,借助日志挖掘的数据预处理技术,获取到用户特征,将自身的Web的服务设计进行优化,开展针对性的网络活动.基于此,在本文中对Web日志挖掘中的数据预处理技术进行研究,提出预处理算法.  相似文献   

3.
介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程.将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程.实践证明,通过对学生平时练习的Web数据进行挖掘分析,可以更合理地控制网络化考试试题的难易程度,有利于进行个性化辅导以及有利于管理员维护试题库.  相似文献   

4.
在计算机数据网络系统技术应用的过程中,数据挖掘技术逐渐成为Web数据挖掘的重要信息形式。由于Web数据库中其数据信息结构相对复杂,涉及到的内容较为广泛,传统的数据挖掘技术不能得到系统性的应用。因此,通过对Web数据挖掘技术的应用及分析,进行了技术的探究。  相似文献   

5.
网络提供了海量的共享资源,人们需要从网络上搜索出自己感兴趣的信息,由此产生了Web挖掘的问题。Web挖掘就是借用数据挖掘技术来实现的。Web挖掘主要是文本信息的挖掘,本文主要研究了实现文本挖掘的层次凝聚类算法,对于传统的算法存在的问题,提出了改进的算法,研究了相似度值对整个算法过程的影响,设计了一个动态改变相似度值的计算公式。  相似文献   

6.
Web挖掘是使用数据挖掘技术在www数据中发现潜在的、有用的模式或信息.关联规则是Web挖掘的一个重要研究领域.根据关联规则挖掘的要求与特点,结合遗传算法,提出一个有效的Web关联规则挖掘方法.实验结果表明,该算法在Web挖掘中具有一定的优势.  相似文献   

7.
随着互联网的广泛使用,Web的数据挖掘技术成为现阶段数据挖掘技术研究的重点,但由于其数据挖掘控制的复杂,对人们的数据挖掘和使用带来了困难。而XML数据挖掘的出现弥补了Web数据挖掘的缺陷,为其带来了方便。  相似文献   

8.
伴随时代的进步与发展,各种新技术也层出不穷,Web数据挖掘技术是当今时代应用比较广泛的一种新技术,该技术是数据挖掘和Web领域相结合的产物,其在高校数字化图书馆的建设过程中发挥了重大作用,本文就针对Web数据挖掘与高校数字图书馆个性化服务进行了分析和研究。  相似文献   

9.
为了提高对Web异常数据的检测及挖掘能力,保障Web网络数据库的安全稳定运行,进行Web异常数据挖掘的软件开发,提出一种基于堆栈弹出中断屏蔽的Web异常数据挖掘方法,并在Bootloader程序开发平台上进行软件开发。首先构建Web异常数据挖掘系统的总体结构模型,采用post关键字编译方法进行Web异常数据的堆栈弹出设计,软件模块化设计包括程序加载模块、数据寄存模块、异常数据交互式编译模块和中断屏蔽模块,创建LabWindows/CVI工程文件进行软件面板开发,生成用户界面文件,实现异常数据挖掘。测试结果表明,该系统能有效实现Web数据挖掘,准确挖掘概率有所提升。  相似文献   

10.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

11.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

12.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

13.
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载。在简述Agent技术和Web数据挖掘技术的基础上,结合多Agent和Web数据挖掘,设计出一种新型数据挖掘模型,且进一步阐述了该模型,并做了一些分析测试。结果证明,该方法能有效提高Web数据挖掘的速度、准确率和覆盖率,提高了数据利用率。  相似文献   

14.
关联规则是捕述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能。弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

15.
遗传算法在Web关联挖掘中的应用研究   总被引:2,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

16.
陈尧妃  倪应华 《现代电子技术》2007,30(2):133-134,137
针对Web挖掘中异构数据源和半结构化的特点,提出基于XML个性化Web挖掘框架模型实现用户兴趣数据的挖掘。分析模型的工作流程,重点讨论实现该模型的关键技术:XML文档统一模型、Web内容预处理模块和Web内容挖掘模块。  相似文献   

17.
针对互联网的数据挖掘在“棱镜”计划中扮演着至关重要的角色.文中首先对数据挖掘的基本技术原理进行了分析,包括关联分析和机器学习的常用算法.然后介绍了互联网信息检索和挖掘的主要技术.接下来提出了一种基于开源云计算平台的互联网大数据挖掘系统架构.最后,对互联网大数据挖掘的发展指出了方向.  相似文献   

18.
Web数据挖掘技术研究   总被引:5,自引:0,他引:5  
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。  相似文献   

19.
在云计算环境下,Web数据挖掘技术得到了快速发展。由于云计算的应用,Web数据挖掘体系已体现出新的特点。分析云计算环境下Web数据挖掘技术的特点,可以明确应用要点,可以实现云计算在数据存储中的突破,实现存储的能力与安全性的提高。从海量数据中高效挖掘有价值的资源,属于信息技术要解决的关键问题。云计算技术支持下的数据挖掘实现了资源的优化配置,体现出实用性、虚拟性的特点,可以保证数据挖掘的高效、精准。因此,有必要构建基于云计算的数据挖掘模式,保证数据挖掘具有更高的精准度,并实现挖掘成本的降低。  相似文献   

20.
基于数据挖掘的Web服务器攻击检测   总被引:1,自引:0,他引:1  
随着Web技术的飞速发展,越来越多的单位使用Web方式为用户提供服务,黑客的矛头也逐渐转向了Web服务器。文中研究了如何使用数据挖掘的方法对Web服务器日志进行安全性分析,从而快速发现攻击,并针对Web服务器日志特有的格式,对现有的基于相似系数的异常点检测算法进行了改进,使其符合研究的要求,同时构建了两个安全性分析的数据挖掘模型。通过对现有Web日志记录的挖掘,验证了所述方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号