首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

2.
利用相对访问率——支持一偏爱度的概念,设计了网站访问矩阵及时间矩阵,并利用这两个矩阵得到用户浏览偏爱路径.实验表明该算法能够准确地反映用户的浏览兴趣,可应用于个性化推荐服务中.  相似文献   

3.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

4.
基于Web日志挖掘的客户访问兴趣分析   总被引:4,自引:0,他引:4  
数据预处理是Web日志挖掘中的一项关键技术,如何分析客户访问兴趣是Web挖掘中的一个重要研究课题。概述了Web日志挖掘的概念、方法和步骤,重点分析了数据预处理的主要步骤及其实现技术,考虑客户访问路径和浏览时间长度等因素,给出并计算分析了网站用户的访问兴趣的方法。汽修之家网站日志的实际测试结果表明了该方法的有效性。  相似文献   

5.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

6.
Web日志中时态约束浏览模式挖掘算法研究   总被引:1,自引:0,他引:1  
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.  相似文献   

7.
Web日志挖掘技术在电子商务网站中的应用   总被引:1,自引:0,他引:1  
在电子商务网站中,可以根据客户的访问日志挖掘出有价值的信息,根据信息划分客户群体和发现潜在的客户,使网站可以提供个性化信息服务和开展有针对性的电子商务活动,从而提升业绩。Web日志挖掘是数据挖掘在web页面上的应用,文章对Web日志挖掘进行了介绍,给出了web日志挖掘的步骤和方法,对Web日志挖掘工具进行了分析,并介绍了其在电子商务网站中的应用。  相似文献   

8.
通过对Web服务器日志件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径。在本算法中,首先以Web站点的URL为行、以UserID为列建立URL—UserID关联矩阵,其元素值为用户的访问次数。然后。采用模糊聚类算法和K-平均算法两种方法分别对列向量进行分析得到相似客户群体,对行向量进行分析可获得相关页面,对后再进一步处理还可以发现频繁访问路径。实验结果表明了算法的有效性。  相似文献   

9.
Web日志挖掘中的用户序列模式识别   总被引:4,自引:0,他引:4  
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性.  相似文献   

10.
Web日志数据预处理   总被引:1,自引:0,他引:1  
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

11.
本文首先介绍了Web挖掘的基本概念和分类,通过对Web使用挖掘的分析,从而挖掘出有意义的模式、规则,来帮助管理者决策。  相似文献   

12.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

13.
本文通过对目前教学网站的现状分析和Web日志挖掘技术的研究,提出了利用Web日志挖掘技术跟踪评估网上教学质量的方法,为提高网站教学质量和改进网站的内容提供了有价值的参考。  相似文献   

14.
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域.  相似文献   

15.
在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务.提出了一种改进了的用途数据预处理模型,在传统的预处理模型基础上添加了页面视图识别步骤,通过试验可以看到改进后的挖掘粒度有更加明确的语义表达,从而提高了挖掘精度.  相似文献   

16.
Web数据挖掘技术及实现   总被引:8,自引:0,他引:8  
在介绍W eb数据挖掘的概念、内涵基础上,探讨了如何在web上用分类器对异构与非结构化数据源进行数据抽取(IE),并建立统一的XML数据格式,进而用Reporting Services和W eb显示控件等技术进行数据挖掘和处理.  相似文献   

17.
网络信息挖掘是目前数据挖掘领域中的一个很重要的研究领域,文章首先介绍网络信息挖掘所面临的问题,然后概要介绍了网络信息挖掘的步骤、分类,及在三个研究领域的挖掘技术及发展,最后简单阐述了网络信息挖掘的应用前景。  相似文献   

18.
通过对Web数据挖掘技术及其在电子商务中的应用进行了研究,发现传统的电子商务Web数据挖掘系统具有挖掘引擎封闭、难以对算法动态管理、挖掘结果难以重复利用的不足,本文提出了基于Web服务技术和移动Agent技术的适用于电子商务领域的Web挖掘系统的架构,此架构具有更好的跨平台性和更高的挖掘效率。  相似文献   

19.
随着Internet的迅速发展,使得“数据丰富而信息贫乏”这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

20.
在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务。提出了一种改进了的用途数据预处理模型,在传统的预处理模型基础上添加了页面视图识别步骤,通过试验可以看到改进后的挖掘粒度有更加明确的语义表达,从而提高了挖掘精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号