首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

2.
Web日志挖掘数据预处理方法研究   总被引:1,自引:0,他引:1  
Web日志挖掘通过分析Web服务器的日志文件发现用户访问站点的浏览模式,预处理是保证高效、快速地挖掘到正确、有用的模式最为关键的环节.笔者分析了数据预处理的具体过程,并对数据预处理方法进行了深入的研究.  相似文献   

3.
Web日志挖掘技术在电子商务网站中的应用   总被引:1,自引:0,他引:1  
在电子商务网站中,可以根据客户的访问日志挖掘出有价值的信息,根据信息划分客户群体和发现潜在的客户,使网站可以提供个性化信息服务和开展有针对性的电子商务活动,从而提升业绩。Web日志挖掘是数据挖掘在web页面上的应用,文章对Web日志挖掘进行了介绍,给出了web日志挖掘的步骤和方法,对Web日志挖掘工具进行了分析,并介绍了其在电子商务网站中的应用。  相似文献   

4.
Web数据挖掘技术在电子商务中的应用越来越广泛,已成为现代电子商务企业获取市场信息极为重要的工具。本文简要介绍了Web数据挖掘的定义等相关内容,并对Web数据挖掘技术在电子商务领域中的应用进行了阐述。  相似文献   

5.
主要研究Web日志挖掘预处理过程中的四项主要技术;对传统的预处理算法做了优化整合;给出一个更加实用的Web日志挖掘预处理算法。实验结果表明,改进后的预处理算法可以提高挖掘结果的兴趣度,同时提高智能站点所生成推荐结果的质量。  相似文献   

6.
Web日志数据预处理   总被引:1,自引:0,他引:1  
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

7.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

8.
Web日志中时态约束浏览模式挖掘算法研究   总被引:1,自引:0,他引:1  
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.  相似文献   

9.
指出现代远程教学存在的弊端,介绍Web挖掘技术的概念、分类及方法,并重点介绍Web日志挖掘的过程和方法,同时提出一个频繁路径遍历算法,最后针对远程教学存在的问题,探讨将Web日志挖掘技术应用于远程教学平台中以实现个性化教学。  相似文献   

10.
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素值逐一比较,获得候选兴趣子路径2-项集,根据支持-偏爱度阈值,将子路径集中不符的子路径剔除,合并子路径,生成用户浏览偏爱路径。实验结果证明了该算法的有效性。  相似文献   

11.
本文首先介绍了Web挖掘的基本概念和分类,通过对Web使用挖掘的分析,从而挖掘出有意义的模式、规则,来帮助管理者决策。  相似文献   

12.
一种Web使用挖掘数据清理方法   总被引:1,自引:1,他引:0  
针对传统的Web使用挖掘数据清理方法不再适用于现有的网络环境的现状,提出了一种新的Web使用挖掘数据清理方法。该方法首次提出以网络流量作为Web使用挖掘的数据来源;将数据清理的问题转变为对用户显式操作产生的HTTP会话的识别问题;使用二进制粒子群算法(BPSO)选出最能精确识别用户显式HTTP会话的特征子集;利用选择出的特征子集,生成决策树用以对用户显式HTTP会话进行识别。实验结果表明:该方法能够准确有效地识别出用户显式HTTP会话,对日志记录数的压缩率达到98.7%,能够完成数据清理的任务,为之后的数据挖掘提供有力的支持。  相似文献   

13.
为了满足站点上更多用户的需求,基于一种整合Web内容挖掘和使用挖掘的个性化推荐算法,在内容挖掘和使用挖掘的预处理阶段,针对XML文档标签化以及内容动态性的特征,提出了一种新的主题权重以及会话有效性衡量的方法,实验证明该方法的推荐值更具准确性和有效性.  相似文献   

14.
XML与Web数据挖掘分析   总被引:4,自引:0,他引:4  
介绍了XML的概念 ,XML优于HTML的方面以及XML的特点、数据挖掘的基本概念及技术 ,概括了Web数据挖掘的特点 ,说明了将XML应用于Web数据挖掘的几个方面 .最后给出一个运用HTML、XML和JAVA技术实现Web挖掘的实例 .  相似文献   

15.
本文从各种数据源采集方法出发,分析各自的局限性,首先确定面向服务器端进行Web使用挖掘,然后进一步分析服务器端数据源的特性,给出针对此数据源的一种数据预处理方案及改进方法,提出数据净化、用户识别、会话识别等关键预处理步骤,为数据挖掘过程提供尽可能准确的目标数据。  相似文献   

16.
基于Web使用挖掘的个性化服务系统   总被引:11,自引:0,他引:11  
个性化服务系统是一种由多种WEB挖掘技术构成的基于用户使用的站点个性化系统。该系统使用事务聚类、使用聚类和关联规则技术等数据挖掘技术分析用户访问模式,并结合用户当前访问情况提供实时化个性服务。实验结果说明,个性化服务系统具有较好的性能。  相似文献   

17.
论述了Web上的数据挖掘技术并作了分析和比较,对Web数据挖掘技术的应用也作了分析和展望.  相似文献   

18.
在Web日志挖掘中应用聚类改进网站结构的研究   总被引:2,自引:0,他引:2  
介绍了Web日志挖掘的概念,通过聚类技术在Web日志中实现挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

19.
基于Web的数据挖掘技术及应用   总被引:1,自引:0,他引:1  
介绍了Web访问行为的数据挖掘,对Web数据挖掘的类型、数据源、过程及应用进行了研究和探讨,详细阐述了Web使用挖掘的挖掘原理和挖掘过程,可为实际应用参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号