首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

2.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣。这种兴趣程度可以通过用户对Web站点上页面的浏览顺序表现出来。Web站点的访问日志记录了用户访问页面的详细信息。在对Web站点的访问日志进行事务识别后,按照访问兴趣对群体用户对Web站点的访问顺序进行聚类分析,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。文中在用户访问兴趣度量中综合考虑用户访问路径、网页内容、在此页面的驻留时间、此页面浏览频度因素,提出了一种基于用户访问兴趣的路径聚类算法。最后通过实验来验证这种算法的有效性。  相似文献   

3.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

4.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

5.
Web日志挖掘技术在电子商务网站中的应用   总被引:1,自引:0,他引:1  
在电子商务网站中,可以根据客户的访问日志挖掘出有价值的信息,根据信息划分客户群体和发现潜在的客户,使网站可以提供个性化信息服务和开展有针对性的电子商务活动,从而提升业绩。Web日志挖掘是数据挖掘在web页面上的应用,文章对Web日志挖掘进行了介绍,给出了web日志挖掘的步骤和方法,对Web日志挖掘工具进行了分析,并介绍了其在电子商务网站中的应用。  相似文献   

6.
运用Web挖掘技术的关联规则Apriori算法,分析学员频繁访问的学习路径,挖掘频繁访问的页面路径.该平台的设计目标是实现山区电大远程教学平台的智能导学.  相似文献   

7.
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。  相似文献   

8.
基于Web日志挖掘的客户访问兴趣分析   总被引:4,自引:0,他引:4  
数据预处理是Web日志挖掘中的一项关键技术,如何分析客户访问兴趣是Web挖掘中的一个重要研究课题。概述了Web日志挖掘的概念、方法和步骤,重点分析了数据预处理的主要步骤及其实现技术,考虑客户访问路径和浏览时间长度等因素,给出并计算分析了网站用户的访问兴趣的方法。汽修之家网站日志的实际测试结果表明了该方法的有效性。  相似文献   

9.
在Web日志挖掘中应用聚类改进网站结构的研究   总被引:2,自引:0,他引:2  
介绍了Web日志挖掘的概念,通过聚类技术在Web日志中实现挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

10.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

11.
Web访问挖掘中事务聚类研究   总被引:4,自引:0,他引:4  
Web访问挖掘可以发现用户浏览Web的目标、兴趣等行为模式,使Web变得更容易获取信息。聚类分析是Web访问挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性。现有的三类聚类算法具有各自的缺点,本文概述了三种算法,给出了一种基于广义后缀树的聚类算法,通过实例说明了它的原理和优点。  相似文献   

12.
随着信息时代与学习型社会的来临,基于因特网技术面向个性化学习的e_Learning的研究受到了普遍重视。本文基于Web挖掘中关联规则的经典Apriori算法,通过对学生高频访问路径和最大向前访问路径两个方面的挖掘,调整系统结构,从而实现向学生进行个性化学习内容的推荐。  相似文献   

13.
当前,搜索引擎是人们从Web上获取信息的主要工具,当用户给搜索引擎一些查询词后,搜索引擎会返回大量的用户不感兴趣的网页。为了解决这一问题,本文从自动推理的角度,提出了一个用户查询词与网页匹配模型。该摸型利用形式概念分析基本理论,提出了OR_RULE和AND_RULE,分别讨论了这些关联规则和用户查询的最小形式概念,并建立了OR_MATCH和ANF_MATCH的推理方法和算法。最后实验证明了该方法是有效的。  相似文献   

14.
针对多数语义Web服务发现算法需要领域本体支持且算法的复杂度较高的问题,利用Google距离来定量测量Web服务输入、输出间的语义距离,并基于Google海量词汇及Google搜索引擎来计算服务间语义相似度.计算时,不需要提供领域本体且基于开放的Google搜索引擎来计算服务匹配度,提高了效率,降低了复杂度.  相似文献   

15.
Struts在Web开发中的应用   总被引:1,自引:0,他引:1  
为了解决使用Struts进行Web开发中的异常处理和安全控制这2个关键问题,综合采用了声明式和编程式2种方法,并且分别给出了典型的应用范围.将异常划分为致命、错误、警告、信息和调试5个级别,在Web层对程序中抛出的自定义异常进行统一捕获和显示.安全控制分为页面、功能、数据行和数据列4个层次,使用角色来划分权限.提出的方案能够满足大部分应用的开发需要,对于一些特殊的应用还要进一步改进和完善.  相似文献   

16.
提出了一个基于隐马尔可夫模型的自适应站点模型。通过对用户访问序列进行语义分析,提取出访问路径中蕴含的信息需求,依此进行站点调整、页面推荐及预取,全面提升了站点的自适应性能。  相似文献   

17.
提出了一种GML文档结构聚类新算法MCF_CLU.与其它相关算法不同,该算法基于闭合频繁Induced子树进行聚类,聚类过程中不需树之间的两两相似度比较,而是挖掘GML文档数据库的闭合频繁Induced子树,为每个文档求一个闭合频繁Induced子树作为该文档的代表树,将具有相同代表树的文档聚为一类.聚类过程中自动生成簇的个数,为每个簇形成聚类描述,而且能够发现孤立点.实验结果表明算法MCF_CLU是有效的,且性能优于其它同类算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号