首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
陈尧妃  倪应华 《现代电子技术》2007,30(2):133-134,137
针对Web挖掘中异构数据源和半结构化的特点,提出基于XML个性化Web挖掘框架模型实现用户兴趣数据的挖掘。分析模型的工作流程,重点讨论实现该模型的关键技术:XML文档统一模型、Web内容预处理模块和Web内容挖掘模块。  相似文献   

2.
李卓玲  王健 《信息技术》2007,(10):142-145
介绍了Web挖掘在个性化服务系统中的作用,指出了Web挖掘的基本过程和关键技术,论述了应用Web挖掘技术实现的个性化网络教学系统的体系结构及其主要算法。  相似文献   

3.
杨秀萍 《现代电子技术》2006,29(18):42-44,46
Internet的普及使得数据挖掘的重点从经典的基于关系数据库的应用转移到了基于Web的应用。首先介绍了Web挖掘的基本概念及其当前发展的几个方向,然后将一种传统的数据挖掘方法关联规则挖掘应用到Web的海量数据上,并给出了挖掘的基本算法,在此基础上挖掘出新的关联规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

4.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。  相似文献   

5.
根据Web日志挖掘的特点,介绍了Web数据挖掘的分类和过程.将关联规则应用到日志挖掘算法中,并利用云理论对关联规则算法进行优化,使之更能符合人的思维方式.  相似文献   

6.
7.
随着互联网的快速发展,Web数据挖掘已经成为当今热门的研究主题。本文介绍了Web数据挖掘的基本概念、Web数据的特点及其Web数据挖掘分类,并对Web数据挖掘技术的研究进行讨论。利用Apriori算法发现频繁集,找到页面间的关联规则。针对网页超链接结构的特点:一条超链接只能建立在两个网页上,发现频繁集只要找出所有2-项集即可,从而提出网页超链接挖掘的NApriori算法。NApriori算法显著提高了Apriori算法的效率。  相似文献   

8.
金加和  张泯泯 《电子测试》2013,(3X):138-139
对用户需求的分析中使用Web挖掘,其中Web个性化的实现使用的是关联规则,这一规则能够为用户提供个性化服务,并且成为Web技术的研究热点。本文以网络教学系统为案例,来对Web挖掘的关联推荐算法进行探讨。内容主要涉及到Web数据挖掘技术、关联推荐算法的思路、算法分析。  相似文献   

9.
一种基于多Agent技术的Web挖掘模型及应用   总被引:1,自引:0,他引:1  
石福斌 《信息技术》2007,31(6):60-63
随着因特网的迅猛发展,计算机拥有了海量的资源,但也困扰着人们获取其中有用的信息。提出了一个基于Multi—agent技术的Web挖掘模型,利用多Agent体系实现数据的收集。最后给出根据该模型设计和实现的某企业人才素质评价系统的实例,系统运行结果证明了模型的有效性和科学性。  相似文献   

10.
张艳肖 《信息技术》2011,(12):10-12,16
K-均值聚类对初始聚类中心的选取较敏感,容易陷入局部最优.将改进的遗传算法与K-均值聚类相结合,以优化聚类中心.在种群进化过程中,父代个体均从种群中适应度高的个体中选择,同时,根据个体适应度动态调节交叉概率和变异概率,避免早熟现象.文中采用改进的遗传算法,对学院网站服务器上的Web日志进行用户和页面聚类,达到了很好的聚类效果.  相似文献   

11.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

12.
刘庆华  姜桦 《通信技术》2008,41(5):108-110
通过Web挖掘分析用户需求,利用关联规则实现Web个性化,向用户提供个性化服务已经成为当今Web技术的研究热点.文中根据网络教学系统的个性化需求,针对Web个性化推荐算法及其改进算法中存在的问题,提出一种结合网站结构和内容挖掘的个性化关联规则的推荐算法.离线生成频繁访问路径聚集图,在线结合网站结构,动态地向用户进行在线推荐.并对改进后的算法进行仿真测试,实验表明改进算法可以更加节约存储空间,提高推荐准确率和覆盖率.  相似文献   

13.
Web服务器日志中记录了用户的浏览模式,为了从中提取出具有相似访问模式的用户群,对其提供个性化服务,提出一种针对Web日志的分析方法。通过构建UserID-URL关联矩阵,引入加权关联矩阵,提出一种基于加权矩阵的聚类算法——多标记传播算法。实验表明,该算法在Web日志挖掘中进行用户聚类和页面聚类是高效可靠的。  相似文献   

14.
基于数据挖掘的Web服务器攻击检测   总被引:1,自引:0,他引:1  
随着Web技术的飞速发展,越来越多的单位使用Web方式为用户提供服务,黑客的矛头也逐渐转向了Web服务器。文中研究了如何使用数据挖掘的方法对Web服务器日志进行安全性分析,从而快速发现攻击,并针对Web服务器日志特有的格式,对现有的基于相似系数的异常点检测算法进行了改进,使其符合研究的要求,同时构建了两个安全性分析的数据挖掘模型。通过对现有Web日志记录的挖掘,验证了所述方法的可行性。  相似文献   

15.
基于Web的文本挖掘研究   总被引:4,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

16.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

17.
关联规则挖掘技术在Web预取中的应用   总被引:5,自引:2,他引:3  
随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难。因此,采用数据挖掘技术从WWW上提取出有价值的知识,提高WWW的服务效率,是具有十分重要的现实意义和广泛的应用前景。本文提出了一种利用关联规则解决网络拥塞问题的方法,即通过对服务器上的日志进行挖掘,得到用户访问序列的关联规则.根据这些规则和用户目前访问网页,把用户后继最有可能访问的网页预先发送给用户,来提高用户浏览速度。  相似文献   

18.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号