首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
Web服务器日志中记录了用户的浏览模式,为了从中提取出具有相似访问模式的用户群,对其提供个性化服务,提出一种针对Web日志的分析方法。通过构建UserID-URL关联矩阵,引入加权关联矩阵,提出一种基于加权矩阵的聚类算法——多标记传播算法。实验表明,该算法在Web日志挖掘中进行用户聚类和页面聚类是高效可靠的。  相似文献   

2.
基于Web使用数据挖掘的个性化推荐系统设计   总被引:1,自引:0,他引:1  
Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐系统架构。它包括三个方面:数据预处理、频繁访问路径挖掘及在线推荐。  相似文献   

3.
用户兴趣空间的Web页面聚类   总被引:5,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

4.
一种基于用户访问模式优化网站结构的算法   总被引:1,自引:2,他引:1  
提出一种算法,通过挖掘Web日志中的关联规则,发现用户访问兴趣间的关联度和站点拓扑结构的不一致,并结合网站既有的拓扑结构,对于通常在用户的某次浏览过程中同时被访问.但在网站拓扑中相距较远的内容页面集,增加页面间的直接链接,最终实现网站系统结构的调整、优化,提高网站的访问效能。  相似文献   

5.
对Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。  相似文献   

6.
数据预处理在Web日志挖掘过程中起着至关重要的作用.论文分析了Web日志挖掘数据预处理的主要步骤,设计了用户识别、访问操作识别和路径完善三个步骤的关键算法.实验结果表明,设计的关键算法是有效的.  相似文献   

7.
伍东  李建  吴波 《现代电子技术》2006,29(21):89-91
通过聚类方法分析用户的行为模式(喜好和习惯),对Web日志数据进行数据净化、用户识别、会话识别、帧页面识别和路径补充,然后自动生成动态的链接,让用户能迅速地从数量庞大的网站网页中找到自己喜欢的、想要的数据,从而节约了用户的网络资源和时间,也提升了网站的竞争能力。  相似文献   

8.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

9.
传统Markov链模型在用户浏览行为预测方面体现出较好的性能,但不能很好的体现出用户的兴趣度和所推荐的页面的重要性,因此本文提出类时齐Markov模型.该模型给不同的类别用户单独创建时齐Markov模型,并用时齐Markov模型的平稳分布表征用户的访问兴趣和页面的重要程度.本文进而提出了基于隐反馈的类时齐Markov推荐模型,在真实的WEB服务器日志数据上的实验证明,类时齐Markov模型具有更好的推荐性能.  相似文献   

10.
提出一种基于最大频繁序列模式的页面推荐技术。由于考虑了用户会话的页面访问顺序,比一些不考虑页面访问顺序的推荐技术有更高的准确率。通过引入一树型结构.其上压缩存储了所有最大频繁序列。由于前缀相同的序列共享共同的树结点,从而大大节省了存储空间。推荐引擎截取用户活动会话中最近被访问的页面子序列,与树的部分路径进行匹配,无需在整个模式库中搜索相同或相似的模式.加快模式匹配的速度.更好地满足页面推荐的实时要求。实验证明,方法是有效的。  相似文献   

11.
Website navigability is acquiring a growing importance in website design and redesign, quality evaluation, and improvement.Existing navigability measures mainly depend on site link structure, so that they only consider the impact of site link structure for navigability and ignore the impact of Web page content. A continuous Markov chain model which depicts the user's surfing behavior can balance these two factors in the evaluation of website navigability, and it needs to estimate the page transition probabilities and user stay time according to user access log. In this way, we can obtain more reliable results for website navigability measure than the existed methods. Experiments show that our method is effective.  相似文献   

12.
基于关联规则的网络行为分析   总被引:1,自引:0,他引:1  
网络用户访问网站的过程中,产生了大量的用户浏览网页的相关记录,隐含着用户在上网过程中的行为习惯。但其中潜在的用户信息难以发现。因此,急需有效的方法提取这些数据中的信息,数据挖掘应用而生。其中,关联规则技术是应用广泛的技术之一。文中利用Apriori算法对Web结构数据进行关联规则挖掘,所得到的规则反映出页面之间的链接关系。分析挖掘结果可得到用户访问的行为规律,为相关网站的安全性和优化改进提供有效的决策依据。  相似文献   

13.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

14.
工业以太网和TCP/IP协议在工业自动化领域的大量应用,为以网页的方式访问PLC数据提供了条件,西门子S7-web2plc更是为这种方式提供了专门的接口。为寻求一种简约灵活低成本的监控方式,借助WEB技术,以SIMATIC PLC和单旋鼓风力喂丝机为对象,阐述了以WEB浏览器为界面实现人机交互和设备监控的方法。该方式简化了控制系统结构、减少了现场操作站数量,并为后期修改监控变量以及INTERNET远程诊断提供了途径。  相似文献   

15.
目前WiFi在室内环境中使用频次高,用户在通过两个相邻AP时会发生AP切换,并累计产生大量WiFi访问日志。WiFi日志中包含定位所需的接收信号强度指示符,在定位系统中直接利用WiFi访问日志中的数据,将极大地简化定位部署复杂度。文中提出了一种在两个相邻AP环境下,基于WiFi日志的多距融合室内定位算法,并通过实验仿真将新算法与路径损耗模型定位方法进行对比。实验结果表明,新算法具有易部署、低成本、低复杂度等特点,当训练样本个数达到300时即可达到稳定定位效果。  相似文献   

16.
基于混合推理系统挖掘用户访问模式的ILP方法   总被引:1,自引:0,他引:1  
提出一种结合DL-safe规则挖掘用户访问模式的ILP方法.该方法首先定义基于事件的日志本体,将DL-safe规则和日志本体构建为一个推理过程可判定的混合日志知识库,在此基础上借助ILp的理论和方法学习生成有效用户访问模式.该方法充分利用日志本体中事件问特定的语义关系有效简化了挖掘过程并提高了挖掘效率,为改进站点结构提供更有效的决策.实验结果表明了该方法的可判定性和有效性.  相似文献   

17.
重点阐述在基于.NET开发的客户关系管理CRM示例系统中设计并实施的一套高透明度、细粒度的角色-用户-权限控制方案。该方案不依赖于具体的实施平台,也不会对架构产生限制。使用XML文件记录角色与页面的映射关系,需要权限控制的页面主动请求检查器验证用户的角色。展示该方案的实施方法,并提出扩展方法及需要注意的问题。  相似文献   

18.
Web挖掘中基于RD_Apriori算法发现用户频繁访问模式   总被引:4,自引:0,他引:4  
从Web日志数据中发现用户的频繁访问模式,可分为两步进行。首先把经过预处理后的目志数据转换为最大前向引用的集合,然后使用Apriori算法挖掘出频繁访问模式。本文针对挖掘的第二步提出了一种基于缩减数据库(Reduced Database)的RD—Apriori算法,此算法能够准确、高效地挖掘各种长度不同的频繁访问模式。  相似文献   

19.
自适应网页设计是一种目前国内外最新流行的网页设计技术,通过对网页页面的大小调整、重新布局等来满足用户来自不同大小的手持移动设备,如笔记本电脑、平板电脑、智能手机等对网页直接实时访问的需求。在能给用户提供理想的网页视觉体验前提下,大大减少了针对于小屏幕移动设备的网页重新开发成本。文中通过总结现有的国外自适应网页设计方法,提出了一个网页的基本自适应框架,并且基于该框架设计并实现了一整套具有网页自适应功能的电子医疗系统。系统测试表明,较普通不具有自适应功能的网页,利用该框架的自适应网页在页面读取速度与访问时间上有显著的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号