首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 531 毫秒
1.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

2.
大量的候选项集是挖掘路径遍历模式中的主要问题.针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈.另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小.实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的.  相似文献   

3.
周锋 《常州工学院学报》2010,23(2):64-66,86
根据远程网络教育的实际情况,指出了传统挖掘算法在该领域的不足,提出了一种基于网络拓扑图的挖掘算法,将对学员频繁访问路径的挖掘转换为对有向图的遍历,向学员实时推荐学习资源,只需扫描一次数据库,降低了系统的开销。  相似文献   

4.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

5.
基于web挖掘的个性化远程教学模型研究   总被引:2,自引:0,他引:2  
提出一种基于web挖掘的个性化远程教学服务系统模型,重点阐述模型结构及功能,并介绍所用到的关键挖掘算法.该系统能充分利用网站上积累的web日记、学生行为及学习成绩记录等信息,通过数据挖掘技术发现用户频繁访问路径、频繁项目集及关联规则模式,自动调整学习者的学习计划和进度,呈现个性化的学习内容,创建自适应教学网站,满足各类学习者需要.  相似文献   

6.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

7.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

8.
运用Web挖掘技术的关联规则Apriori算法,分析学员频繁访问的学习路径,挖掘频繁访问的页面路径.该平台的设计目标是实现山区电大远程教学平台的智能导学.  相似文献   

9.
提出了基于量值的频繁闭项集层次聚类算法CFIHCQ,并将其应用于Web使用挖掘。该算法首先通过用户Web访问数据获取频繁闭项集;其次,以频繁闭项集对簇进行初始化,并以打分的方式将用户指入唯一簇;再次按照簇标记生成自上而下的簇树结构,并使用用户访问向量分裂子簇;最后,对簇树进行剪枝。实验表明,该算法能够很好的预测用户Web访问行为;在海量用户数据情况下,可满足实时挖掘的需求;并能以树结构展示挖掘结果。  相似文献   

10.
通过对Web服务器日志件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径。在本算法中,首先以Web站点的URL为行、以UserID为列建立URL—UserID关联矩阵,其元素值为用户的访问次数。然后。采用模糊聚类算法和K-平均算法两种方法分别对列向量进行分析得到相似客户群体,对行向量进行分析可获得相关页面,对后再进一步处理还可以发现频繁访问路径。实验结果表明了算法的有效性。  相似文献   

11.
指出现代远程教学存在的弊端,介绍Web挖掘技术的概念、分类及方法,并重点介绍Web日志挖掘的过程和方法,同时提出一个频繁路径遍历算法,最后针对远程教学存在的问题,探讨将Web日志挖掘技术应用于远程教学平台中以实现个性化教学。  相似文献   

12.
Web访问挖掘中事务聚类研究   总被引:4,自引:0,他引:4  
Web访问挖掘可以发现用户浏览Web的目标、兴趣等行为模式,使Web变得更容易获取信息。聚类分析是Web访问挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性。现有的三类聚类算法具有各自的缺点,本文概述了三种算法,给出了一种基于广义后缀树的聚类算法,通过实例说明了它的原理和优点。  相似文献   

13.
基于Web日志挖掘的客户访问兴趣分析   总被引:4,自引:0,他引:4  
数据预处理是Web日志挖掘中的一项关键技术,如何分析客户访问兴趣是Web挖掘中的一个重要研究课题。概述了Web日志挖掘的概念、方法和步骤,重点分析了数据预处理的主要步骤及其实现技术,考虑客户访问路径和浏览时间长度等因素,给出并计算分析了网站用户的访问兴趣的方法。汽修之家网站日志的实际测试结果表明了该方法的有效性。  相似文献   

14.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣。这种兴趣程度可以通过用户对Web站点上页面的浏览顺序表现出来。Web站点的访问日志记录了用户访问页面的详细信息。在对Web站点的访问日志进行事务识别后,按照访问兴趣对群体用户对Web站点的访问顺序进行聚类分析,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。文中在用户访问兴趣度量中综合考虑用户访问路径、网页内容、在此页面的驻留时间、此页面浏览频度因素,提出了一种基于用户访问兴趣的路径聚类算法。最后通过实验来验证这种算法的有效性。  相似文献   

15.
给出了数据挖掘系统的体系结构 ,XML能为Web数据挖掘带来巨大的发展契机 ,提出了在Web中发现大访问路径的算法 ,基于Web的数据挖掘可广泛用于银行、保险、电信、商业等领域。  相似文献   

16.
随着信息时代与学习型社会的来临,基于因特网技术面向个性化学习的e_Learning的研究受到了普遍重视。本文基于Web挖掘中关联规则的经典Apriori算法,通过对学生高频访问路径和最大向前访问路径两个方面的挖掘,调整系统结构,从而实现向学生进行个性化学习内容的推荐。  相似文献   

17.
通过对移动大数据的分析和挖掘,能够提升终端感知,并为用户换机推荐提供强有力的数据支持。基于早期终端营销存在的问题与不足,提出了基于大数据挖掘的终端感知与换机应用系统解决方案,具体包括基于聚类算法的隐性换机用户提取方法,基于神经网络的指标分析法,基于决策树的换机预测方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号