首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
缩短Web访问中的用户感知时间,是Web应用中的一个重要问题,服务器需要预测用户未来的HTTP请求和处理当前的网页以提高Web服务器的响应速度,为此提出了一种基于用户访问模式的Web预取算法.该算法根据Web日志信息分析了用户的访问模式,并计算出Web页面间的转移概率,以此作为对用户未来请求预取的依据.实验结果表明,该预取算法能有效提高预测精度和命中率,有效地缩短了用户的感知时间.  相似文献   

2.
韩真  曹新平 《计算机应用》2005,25(3):670-672
分析了访问用户和浏览器的行为,研究了现存的Markov预取模型,并分析了Markov预测模型的本质,在此基础上,提出了基于TOP N选择的Markov预测模型。该模型利用Web访问日志中请求次数大于N的URL生成TOP N,根据用户的访问会话生成Markov链。如果用户当前的访问会话与Markov链匹配,该Markov的下一URL在TOP N中,就把它取到本地缓存。实验表明,该预测模型能有效提高预测精度和命中率,在一定程度上还减少了带宽的需求。  相似文献   

3.
基于客户端的网页预取模型   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种基于客户端的网页预取模型。此模型以WPC方法为理论核心,WPC方法以客户端用户访问日志数据为依据,从中挖掘出Web用户的访问模式再通过提出的模式匹配算法进行网页预测,还提出基于Agent的Web预取系统具体应用WPC方法进行网页预取决策。此模型避免或简化了一般的网页预取模型对Web日志进行的复杂的预处理的一些步骤,其中包括数据净化,用户识别,用户会话识别和事务识别等,从而提高了预取效率。实验结果表明该模型能够达到较为理想的预取效果,具有较高的实用价值。  相似文献   

4.
Web服务器上的日志文件记录了用户访问的许多有用的信息,分析和以它建立相应的预测模型,预测区域用户将来的访问行为,对提高Web服务器管理和服务质量,无疑是十分有价值的;Neuro-Fuzzy方法是将神经网络和模糊逻辑有机的结合,用于解决复杂的非线性问题;用它来进行Web服务器区域流量预测,是一种新的思路和方法。文章主要介绍了模型构造的基本思想、结构、算法,也介绍进化式聚类方法和预测过程;同时,给出了实验数据及分析。  相似文献   

5.
数据挖掘与互联网技术的融合,使得在互联网页面存取记录当中执行数据挖掘成为可能。互联网页面访问者的行为被镌刻在Web服务器的日志文件当中。分析和探求这一行为当中的规则性,能够改善系统性能,提高提供给终端用户的互联网信息服务质量,预计电子商务的潜在客户群。把终端用户分为簇,只有访问路径相似的终端用户才被归入相同的簇。采用适当的聚簇方法,根据用户请求网页的顺序相似性,也就是他们页面访问记录的相似性,来把用户聚簇。这样如果知道一组网页总是被一起访问,当用户访问其中之一时,就可以把这一组网页放入缓存,以加快信息传递速度。本文分析Web日志数据挖掘算法,从正确性、通用性等多方面对层次聚簇算法和K-均值聚簇算法进行比较和验证。  相似文献   

6.
一种基于用户的LNS文件预测模型   总被引:1,自引:0,他引:1       下载免费PDF全文
许多系统把数据访问请求当作是独立的事件。实际上,数据请求并非完全随机,而是由用户或程序的行为驱动的,不同的用户或程序存在不同的访问模式。LS(Last Successor)模型简单,但非常有效,然而它的预测结果严重依赖于用户或程序的访问顺序。提出了ULNS(User-based Last N Successors)文件预测模型,利用用户信息来提高预测精确度,并综合LS模型来改进算法的可适用度。实验结果表明,该预测模型具有较好的整体性能。  相似文献   

7.
针对网页被篡改后的访问保护和快速恢复问题,以分布式网页防篡改系统的备份恢复为背景,提出一种基于本地快照和Rsync同步的Web文件保护方法.当Web页面被篡改时,Web服务器通过快照技术将原Web页面的映像发送给用户浏览,使得系统完好无损,进一步调用Rsync算法从备份服务器上同步Web文件,从而实现恢复.实验结果表明,该方法可保护被篡改页面不被访问,具备较好的快速恢复性能.  相似文献   

8.
基于Web使用挖掘的思想,通过在Web日志文件中加入用户页面动作记录,结合浏览页面和页面行为两方面的内容,设计算法计算支持度计数,进行关联规则挖掘,力图提取更加准确的用户购买模式;参照这些模式,利用一种混合模式算法对Web站点匿名访问用户的购买概率进行预测,建立预测模型,并给出了实验结果分析.提出的模型对企业的客户关系管理具有积极的意义.  相似文献   

9.
基于预测的Web缓存替换算法   总被引:2,自引:0,他引:2  
为了提高Web缓存的性能,在缓存替换算法GDSF的基础上引入了预测机制,提出了基于预测的缓存替换算法PGDSF.先利用Web日志构造预测模型,再用预测模型对当前的用户访问序列进行预测,形成用户可能要访问的预测对象集.当缓存空间不能满足新请求对像时,则利用替换策略GDSF,将权值最小的且不属于预测对象集的对像进行替换.该算法综合考虑了各项因素对Web对象的影响,仿真实验结果表明,在一定的缓存空间内相对于GDSF替换算法有较高的文档命中率和字节命中率.  相似文献   

10.
吕佳 《计算机科学》2007,34(4):204-206
Web日志隐含了用户访问网站的行为和特点,对其进行聚类分析可以获取用户的浏览模式,发现用户访问网站的偏好和兴趣,从而优化站点结构,实现个性化的服务。针对Web日志数据特点,本文提出免疫网络聚类算法。该算法将Web服务器看成生物机体,用户访问Web的请求序列看成需要检测的入侵抗原,模拟抗体学习抗原的生物机理,自动生成代表用户访问模式的记忆抗体,实现动态聚类。  相似文献   

11.
基于用户日志的查询扩展统计模型   总被引:24,自引:0,他引:24       下载免费PDF全文
崔航  文继荣  李敏强 《软件学报》2003,14(9):1593-1599
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.  相似文献   

12.
由于现有的Web日志缺少明显语义,提出一种语义Web日志模型--SWLM,并给出基于该模型的网页和用户聚类算法.通过日志概念的语义距离定量计算来聚类网页和用户,奠定了Web个性化服务的基础.性能测试实验证明,该模型具有较好的整体性能,能有效地进行网页和用户聚类.  相似文献   

13.
Web servers keep track of web users' browsing behavior in web logs. From these logs, one can build statistical models that predict the users' next requests based on their current behavior. These data are complex due to their large size and sequential nature. In the past, researchers have proposed different methods for building association-rule based prediction models using the web logs, but there has been no systematic study on the relative merits of these methods. In this paper, we provide a comparative study on different kinds of sequential association rules for web document prediction. We show that the existing approaches can be cast under two important dimensions, namely the type of antecedents of rules and the criterion for selecting prediction rules. From this comparison we propose a best overall method and empirically test the proposed model on real web logs.  相似文献   

14.
基于Web日志的信息挖掘具有重要的意义,比如识别兴趣相似的客户群体有利于实现推荐和个性化服务。采用了多元线性回归分析用户浏览行为,直接对兴趣相似矩阵进行λ截聚类,最后通过计算项与类的连接强度来调整聚类结果。实验结果证明了该算法具有较高的准确率和良好的扩展性。  相似文献   

15.
基于网络用户行为的搜索引擎系统SISI   总被引:1,自引:0,他引:1  
郭岩 《计算机工程》2004,30(16):9-11,13
提出了一种基于网络用户行为的搜索引擎SISl(Similar Interest,Similar access on Internet)。SISI的查询输入是一个Web文档的URL。SISI的检索模型是使用统计的方法基于网络日志中用户对文档的访问频率挖掘相关文档,充分利用了用户在相关文档判定上的潜在意识。模型的假设基础是一组兴趣相似的人访问的文档有可能相关。与传统的搜索引擎相比较,搜索引擎SISI具有系统初始化时间代价小、空间代价小等优点。同时SISI的检索优势在于可以查找那些没有显式相似内容的相关文档,尤其是在检索处理时避开了文档的类型,将文本文档和多媒体文档一视同仁。  相似文献   

16.
一种新的预测用户浏览模式的度量方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在Web环境中,度量用户的浏览模式对Web站点结构的改进是有益的。挖掘和度量Web日志能够识别用户的访问模式模型,Web站点管理者能够应用这些模型研究用户的访问偏爱度,由此改进站点的体系结构以及分析这些改进带来的影响。因此,提出用户群偏爱度这样一个新概念,并使用了基于用户群的模糊聚类算法(UGFC),然后根据聚类结果,即具有相似访问习惯的用户群体,度量用户群偏爱度,再基于用户群偏爱度,利用混合阶Markov模型(HOMM)进行预测。实验表明,这种新的度量预测方法(UGFC-HOMM)比传统Markov模型(TMM)预测更准确,并且实验用精确率、覆盖率和运行时间这3个度量评价值对预测性能进行评估。  相似文献   

17.
通过对电子商务中服务器上的日志文件等Web数据进行客户访问信息的分析,重点研究了客户分析系统的数据采集、数据处理以及跟踪客户在Web上的浏览行为并进行模式分析,并构建了用户访问模式的挖掘模型及算法的分析与实现。  相似文献   

18.
针对Web应用带宽资源管理问题,提出了一种基于网络仿真的Web应用带宽需求和服务质量(QoS)预测方法,该方法给出了适用于Web服务的建模框架与形式说明,采用简化的并行负载模型,并运用自动化数据挖掘方法从Web应用访问日志中提取模型参数,并使用网络仿真工具建立系统模型模拟复杂网络传输过程,能够预测不同负载强度下的带宽需求和QoS变化。通过TPC-W基准测试系统验证该方法预测结果的准确性,理论分析和仿真结果表明,与传统的线性回归预测相比,网络仿真可以稳定地模拟真实系统,其对总请求数和总字节数的预测平均相对误差分别为4.6%和3.3%。最后以TPC-W基准系统为例,对Web应用不同带宽伸缩方案进行仿真评估,评估结果可以为Web应用资源管理提供决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号