共查询到20条相似文献,搜索用时 78 毫秒
1.
Web用户访问模式挖掘研究 总被引:5,自引:0,他引:5
1 引言目前World Wide Web(WWW)已经发展成为拥有近亿个工作站、数十亿页面的分布式信息空间,在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,也带来了巨大的经济效益和社会效益。对于不同层次、不同使用目的和爱好的浏览者需要个性化的信息服务,希望网站能够根据自己的浏览习惯,动态定制 相似文献
2.
电子商务网站用户访问模式挖掘中的预处理技术 总被引:6,自引:0,他引:6
对电子商务网站的用户访问模式挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括源数据的采集方法以及数据清理、用户识别、会话识别、事务识别、会话子序列生成等所采用的技术。并给出了框架网页过滤、识别搜索引擎Robot产生的访问记录,以及生成用户会话语义序列的方法。 相似文献
3.
一种基于图结构挖掘WEB用户访问模式的方法 总被引:3,自引:0,他引:3
挖掘Web用户访问模式常用的技术有Web挖掘特有的路径分析技术和数据挖掘领域的传统技术。文章首先分析了现有路径分析技术的不足,然后从Web用户访问模式挖掘过程预处理的结果用户会话文件开始,提出了一种基于Web拓扑结构(图结构)挖掘用户访问模式的方法,提高了发现模式的精确性和效率,并在实验室对该方法进行了简单实现和实际日志数据的测试。 相似文献
4.
周文鹏 《计算机与数字工程》2010,38(8):58-61
为满足用户及时获取个性化信息的需求,利用数据挖掘中的聚类分析方法对Web日志数据进行聚类,对网站已有用户的访问行为进行划分,得出各类别用户网页推送的数据集;采用关联规则方法提取聚类结果中各个簇的访问规则,完成个性化页面推送服务。结果表明该模式能够实现网站个性化页面推送的功能。 相似文献
5.
Frequent operation pattern is an important characteristics of user operati,m. It measures thedegree of user dependencies and preferences upon the software functionality. This paper focuses on theapplication of data mining techniques in the design and implementation of interlace Agent, and presentsthe concept of frequent user operation pattern and its discovery algorthm. The algorithm is well suitedfor time-restrict data mining tasks. 相似文献
6.
7.
基于双Kohonen神经网络的Web用户访问模式挖掘算法 总被引:1,自引:0,他引:1
本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网络挖掘模型,相对于标准Kohonen神经网络在训练速度和收敛效果上都有一定程度的提高,改善了聚类效果,为挖掘用户的多种兴趣提供了一种可行的方法。 相似文献
8.
用户访问兴趣路径挖掘方法 总被引:1,自引:1,他引:1
针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。 相似文献
9.
针对Web用户访问模式问题,采用最大频繁访问路径(MFP)方法可以挖掘出更有普遍意义的模式。给出一种新的用户访问模式树WUAP tree结构,并采用E OEM模型,综合考虑了页面拓扑结构及用户浏览路径等多个数据源,进一步提出了一种Web访问模式挖掘算法WUAP mine。该算法不用产生候选集和递归,只对事务数据库进行一次扫描,对WUAP tree结构进行深度优先遍历一次,就可从WUAP tree结构上直接查询出Web用户频繁访问模式。最后,从理论和实践上推导和验证了它的有效性和高效性。 相似文献
10.
通过结合网站设计初期的网站结构和典型用例的预先定义,构建一个基于Web日志数据的用户访问数据分析系统。该系统(AS-UAB,Analysis System of User Access Behaviors)通过对网站结构和典型用例的预先植入,利用该领域最新的研究方法和结论,为网站相关人员提供可视化的用户访问信息统计及趋势预测,网站结构设计及交互设计上存在的问题及改进建议等通用功能和个性化定制功能。 相似文献
11.
基于用户访问树的Web日志挖掘数据预处理 总被引:1,自引:0,他引:1
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献
12.
13.
阐述软件设计模式的概念及其作用,并分析了.NET平台ADO.NET的特点,运用抽象工厂和外现两种设计模式对数据访问组件进行了设计和实现,实现了业务层和数据层的连接,达到了较好的通用性、扩展性和维护性. 相似文献
14.
为提高聚类算法的准确性,通过先对数据集抽样,再对样本数据进行K-means聚类,选出聚类中心,然后为整个数据集中的每个簇单独设置一个阈值的方法对传统的BIRCH算法进行改进。实验表明,在同等条件下,改进后的算法相比传统的BIRCH算法精确度更高,耗时更少。 相似文献
15.
数据预处理是Web使用挖掘的一个关键环节,数据预处理的结果直接影响到后续步骤,如事务识别、路径分析、关联规则挖掘和序列模式挖掘的效果。提出了一种精确识别用户和会话的数据预处理算法(USIA),并且用实验证明它是高效的。 相似文献
16.
基于数据挖掘的用户安全行为分析 总被引:2,自引:1,他引:2
通过对用户网络流量进行协议投影,获得其行为的具体信息,然后采用关联规则等方法,将上面得到的信息进行统计学习,从而得到该用户所特有的行为模式。利用这种模式,可以进行网络用户的身份识别。实验结果表明,该方法为进行用户网络行为特征提取和身份识别提供了一种新思路,另外也有助于发现蠕虫或其他大规模入侵行为。 相似文献
17.
基于用户浏览时间的模式聚类算法 总被引:3,自引:0,他引:3
该文研究了基于用户访问时间的模式挖掘算法。对于具有公共访问子模式的用户,利用它们浏览页面的时间,设计和实现了一个简单而有效的聚类分析方法。 相似文献
18.
Web日志挖掘数据预处理研究 总被引:6,自引:0,他引:6
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献
19.
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式,以便进一步改善网站结构或为用户提供个性化的服务。文中探讨了Web日志挖掘中的用户识别算法,提出了一种多重约束条件的用户识别算法。 相似文献
20.
基于Web日志挖掘的个性化服务站点 总被引:2,自引:1,他引:2
介绍个性化站点的概念,并对Web日志挖掘系统体系结构进行分析。其后将关联规则挖掘技术应用到日志事务会话中,在对日志数据的特性分析的基础上提出类Apriori挖掘算法。对类Apriori挖掘算法得到的频繁项集如何有效提取关联规则提出了最有效的方法。在实际应用中探讨了如何从多个匹配的关联规则中选择合适的匹配规则。 相似文献