首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于Web使用挖掘的用户行为分析   总被引:9,自引:0,他引:9  
张波  巫莉莉  周敏 《计算机科学》2006,33(8):213-214
Web服务产生了大量的日志数据,这些数据记录了用户的行为信息。如何从海量的日志数据中自动、智能地抽取隐藏于其中的知识,这是本文要研究的问题。基于Web使用挖掘,对点击流数据源进行收集、预处理,并基于FP-tree的关联规则挖掘算法对用户行为进行分析,发现新模式,为优化网站建设提供有价值数据。  相似文献   

2.
集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移挖掘算法   总被引:2,自引:0,他引:2  
提出了一种集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移模式的模型和算法。介绍了Web页面及其聚类。通过替代用户事务中的页面为相应聚类的方法得到用户浏览兴趣序列。从用户浏览兴趣序列中得到用户浏览兴趣迁移模式。该模型对于网络管理者理解用户的行为特征和安排Web站点结构有较大的意义。  相似文献   

3.
基于Web数据挖掘的用户浏览兴趣路径研究   总被引:1,自引:0,他引:1  
使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集。实例分析表明该算法是可行和有效的,对于电子商务网站的优化和实施个性化服务具有意义。  相似文献   

4.
针对Web使用挖掘中的信息,提出一种基于遗传算法的关联规则挖掘模型,同时结合实例对有关信息特征进行量化,然后利用实数数组的方法进行编码以及构造适应度函数,挖掘出隐含在用户注册登记信息库中的有关用户规则.为个性化服务系统提供准确和可行的关联规则,并对用户的行为进行了预测和分析.  相似文献   

5.
Web使用挖掘的数据采集   总被引:10,自引:0,他引:10  
邢东山  沈钧毅 《计算机工程》2002,28(1):39-41,46
介绍了Web使用挖掘的特点和用途,分析了4级数据采集技术,重点强调了用户浏览页面时间的正确获取方法,最后对这些采集方法的具体应用进行了阐述。  相似文献   

6.
Web使用模式挖掘研究   总被引:3,自引:0,他引:3  
Web使用模式挖掘是利用Web使用数据的高级阶段,文中分析了Web使用模式挖掘流程及挖掘技术后,架构了一种用于Web使用模式的工具,并将其应用在优化Web站点的链接结构,发现潜在客户等方面。  相似文献   

7.
Web使用挖掘研究   总被引:5,自引:1,他引:5  
Web数据挖掘是数据挖掘技术在Web信息仓库中的应用与研究。Web数据挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘三个研究方向,文中研究的重点是Web使用挖掘。Web使用挖掘研究的主要对象是用户的使用记录,研究的主要过程包括数据预处理、模式发现和模式分析。文中详细介绍了Web使用挖掘的最新研究成果,并对将来技术的研究方向和发展趋势进行了探讨性的预测与分析,为进一步的理论研究和实际应用工作提供了指导性的建议。  相似文献   

8.
Web数据挖掘是数据挖掘技术在Web信息仓库中的应用与研究.Web数据挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘三个研究方向,文中研究的重点是Web使用挖掘.Web使用挖掘研究的主要对象是用户的使用记录,研究的主要过程包括数据预处理、模式发现和模式分析.文中详细介绍了Web使用挖掘的最新研究成果,并对将来技术的研究方向和发展趋势进行了探讨性的预测与分析,为进一步的理论研究和实际应用工作提供了指导性的建议.  相似文献   

9.
提出了一个结合Web文本挖掘的分布式Web使用挖掘模型DWLMST,以及基于该模型的局部浏览兴趣迁移模式更新算法LITP和全局浏览兴趣迁移模式更新算法GITP。利用页面聚类来表示用户兴趣。通过将用户事务中的页面替代为相应的聚类号来得到用户浏览兴趣序列。从用户浏览兴趣序列中分析得到用户浏览兴趣迁移模式。算法较好地解决了Web访问信息的异地存储、实时增长等因素给模式分析过程带来的困难,同时也提高了用户浏览兴趣表示的准确性。  相似文献   

10.
Web使用信息挖掘综述   总被引:30,自引:1,他引:29  
Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为PWeb框架,分别介绍了数据预处理的技术与困难,Web使用信息挖掘中常用的方法和算法,以及主要应用。  相似文献   

11.
基于分布式的Web log挖掘模型   总被引:1,自引:0,他引:1  
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。  相似文献   

12.
Web挖掘研究   总被引:285,自引:4,他引:285  
因特网目前是一个巨大,分布广泛,全球性的信息服务中心,它涉及新闻,广告,消费信息,金融管理,教育,政府,电子商务和许多其它信息服务,Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源,Web挖掘就是从Web活动中抽取感兴趣的潜在有用模式和隐藏的信息,对Web挖掘最新技术及发展方向做了全面分析,包括Web结构挖掘,多层次Web数据仓库方法以及W eb,Log挖掘等。  相似文献   

13.
企业的Web日志中蕴藏着丰富的信息.首先从企业绩效的角度出发,提出以企业营运能力的绩效评价为目标的Web被访信息的空间存储模型,模型中存储了访问时间序列、访问轨迹和评价指标等信息;然后将绩效评价体系的理论、基于Web的信息技术、数据挖掘技术集成,利用关联规则挖掘算法实现对因特网内的大范围Web日志的内容分析和主题挖掘,建立了基于Web挖掘的企业绩效方法.该模型为企业进行绩效评价提供了一种新思路.  相似文献   

14.
本文首先分析了Web用法挖掘的数据源-Web日志文件的内容和格式,建立了一种适用于Web用法挖掘的关联挖掘数学模型DPR,并利用深度优先搜索算法进行了仿真实验。  相似文献   

15.
人工神经网络(ANN)为Web挖掘技术提供了一种新思路.针对传统聚类方法面对大量动态增长的Web日志数据健壮性和灵活性不够的缺点,提出了一种基于自组织映射神经网络的用户信息聚类模型,最后给出的实例证明在此基础上的Web页面的个性化推荐算法能够有效地进行Web页面个性化推荐.  相似文献   

16.
在分析现有挖掘用户频繁路径技术不足的基础上提出算法MUFPS(Mining User Frequent Paths based on Supportability).该算法主要通过用户会话文件计算出所有被请求页面各自的支持度总和,并结合Web站点结构挖掘出该用户的频繁访问路径.通过实验对比证明该算法能有效地提高挖掘效率,同时保证了挖掘结果的准确性和可靠性.  相似文献   

17.
本文将互关联后继树(Inter-Related Suffix Tree,IRST)模型应用于Web日志事务挖掘,构造Web日志事务集的互关联后继树结构,从中挖掘频繁路径。通过实验证明了基于IRST的Web日志挖掘系统有优秀的性能。  相似文献   

18.
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设计基于三元互关联后继树的频繁路径挖掘算法,挖掘Web日志中的频繁路径。通过实验证明了基于三元互关联后继树和改进后的模型的出色插入查询性能。  相似文献   

19.
PAPPM:一种自适应Web预测模型   总被引:1,自引:0,他引:1  
提出了一种自适应PPM(Prediction by Partial Match)预测模型:PAPPM。该模型能在预测过程中使用基于熵的自适应选阶策略选择最优阶,降低了预测开销。而且,它能根据当前用户访问的Web序列实时地更新预测模型,保证了预测模型的新鲜度。实验表明,PAPPM提高了预测精度和预测命中率,适用于在线Web预取。  相似文献   

20.
基于CRISP-DM(cross-industry standard process for data mining)模型设计与实现了一个时序预测Web服务,对网站资源的下载需求量进行预测。重点阐述了CRISP-DM模型应用于时序预测任务时的设计思想和实现的关键技术。测试结果表明,该时序预测Web服务具有较高的预测准确率,部署快速,使用方便,对解决同类问题具有一定的示范和参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号