首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
WWW 上用户的访问路径信息会被记录在WEB 服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB 网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD 上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT 中weight相似文献   

2.
用户对Web网站访问兴趣可以通过页面的浏览顺序表现出来,Web站点的访问日志记录了用户访问页面的详细信息.介绍Web站点访问日志挖掘的相关知识,并定义新的兴趣度,相似度和聚类中心,提出了一种基于用户访问兴趣的路径聚类算法,最后通过实验来验证这种算法的有效性.  相似文献   

3.
于华  张文盛 《办公自动化》2012,(12):23-24,29
Web日志挖掘的研究对象是Web日志数据,挖掘的对象是提供服务的网站的信息,挖掘结果可以帮助改善网站的设计,本文基于Web日志挖掘提出一种网站优化方案,本方案采用AprioriAll算法对用户频繁访问路径进行挖掘,根据挖掘结果进行模式分析,最终实现网站结构的调整、优化,提高用户满意度和站点的访问率。  相似文献   

4.
Web站点导航是Web数据挖掘的一个重要研究领域,是准确理解用户访问网站行为的关键;传统Web站点导航技术很难全面反映出用户对页面浏览的兴趣程度,找到用户感兴趣页面路径准确度比较低;为提高找到用户感兴趣页面路径准确度,提出一种基于蚁群算法的Web站点导航技术;将网络用户看作人工的蚂蚁,用户的浏览兴趣作蚂蚁的信息素,通过利用Web日志数据采用正负反馈机制和路径概率选择机制建立一个Web站点导航模型,挖掘用户感兴趣页面的导航路径;仿真实验结果表明,基于蚁群算法的Web站点导航技术提高了找到用户感兴趣页面路径准确度,更加能够准确反映出用户的浏览兴趣,用于Web站点导航是可行的。  相似文献   

5.
Web日志中保存着用户访问网站的大量信息,通过挖掘预处理后的日志数据,可以得到用户聚类,URL聚类以及用户频繁访问路径等诸多有用信息。本文先分析处理网站的日志数据,再阐述了Web日志挖掘的算法,最后讨论了Web日志挖掘的应用。  相似文献   

6.
Web日志预处理在很大程度上影响着Web日志挖掘的质量,而Web日志预处理的一项重要工作就是对用户访问路径中的页面缺失进行补充。本文提出一种基于简化站点结构的路径完善技术,既无损于对用户频繁访问模式的分析,也适合于Web日志的增量挖掘。  相似文献   

7.
本文在对Web日志挖掘理论和Apriori算法研究的基础上,设计和实现了Web访问日志挖掘系统,并将该挖掘系统应用于学院网络中心的"招生信息网"上,对Web服务器的日志记录进行了挖掘实验,找出用户的频繁访问路径,得到较为理想的结果。  相似文献   

8.
Web日志的高效多能挖掘算法   总被引:76,自引:0,他引:76  
通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径,提出了一种新颖的Web日志挖掘算法。在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵、元素值为用户的访问次数,然后,在列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步还可以发现频繁访问路径。实验结果表明了算法的有效性。  相似文献   

9.
本文旨在研究基于Web环境下利用关联规则对Web日志挖掘的数据分析系统。把关联规则的概念引入到Web日志挖掘中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。然后在Apriori挖掘算法思想的基础上,对其改造,给出了适合挖掘用户访问频繁路径的类Apriori算法。最后设计开发了一个Web日志数据分析系统。此系统主要包含三个功能模块:数据预处理模块、智能分析模块和基本分析模块  相似文献   

10.
一种基于路径聚类的Web用户访问模式发现算法   总被引:7,自引:0,他引:7  
本文在将用户对Web站点访问行为表示成用户访问事务基础上,给出有关兴趣度、相似度、聚类中心定义,提出基于ISODATA算法的路径聚类方法,并对实际网站Web日志文件进行实验,结果表明该方法不但能够发现群体用户访问模式。而且还得到较为合理的模式聚类个数。  相似文献   

11.
卓林  杨舟  赵朋朋  崔志明 《计算机工程》2011,37(5):59-61,64
提出一种基于混合二维条件随机场的Web记录抽取模型,以克服线性链条件随机场不能充分利用Web实体间二维依赖关系的缺点,且训练条件随机场模型时无需大量手工标注的样本数据。对当当网上的742个数据记录进行抽取,对比同等情况下的其他模型。实验结果表明,混合二维条件随机场模型在抽取TDS数据集时展现了更优越的性能。  相似文献   

12.
随着Internet上Web服务的快速增长,客户如何发现想要的Web服务,已经是Web服务技术中的难点和关键问题。鉴于UDDI注册中心的Web服务描述信息非常稀疏的特点,传统的基于关键字的服务匹配机制UDDI缺乏语义支持,搜索效率低;为了在UDDI注册中心提供的用WSDL描述的和未来用语义本体描述的Web服务信息的基础上提高Web服务匹配的查准率和查全率,提出了一种新的本体相似匹配方法,使Web服务匹配在查准率和查全率方面都有所提高。  相似文献   

13.
基于Web数据挖掘的用户浏览兴趣路径研究   总被引:1,自引:0,他引:1  
使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集。实例分析表明该算法是可行和有效的,对于电子商务网站的优化和实施个性化服务具有意义。  相似文献   

14.
在基于人工智能理论的Web服务自动组合推理中,推理的复杂度呈指数级增长,难以在实际中应用。针对上述问题,提出一种基于QWS数据集的Web服务集消减算法RfWss-QWS,从Web服务的评估、调用、监控和管理出发,选择效率、稳定性和价格等最优的服务,从而最大限度地消减服务集,得到一个精简且完备的服务集合用于服务的自动组合推理。  相似文献   

15.
数学公式与WEB   总被引:13,自引:0,他引:13  
文章首先研究了数学公式在Web上的发展和问题,而后介绍了W3C组织提出的一种基于可扩展标记语言(XML)的数学标记语言(MathML),它主要包括表现(Presentation)和表义(content)两种形式。文章认为MathML将成为数学材料计算机化的最重要的标准。最后,文章介绍了一个基于MathML的应用系统-SeeMath的设计和体系结构。SeeMath为数学公式在Web上显示提供了一个集成的解决方案。  相似文献   

16.
基于数字地球的WebGIS开发及其应用   总被引:4,自引:0,他引:4       下载免费PDF全文
空间地理数据的传输、处理以及展示对WebGIS提出了更高的要求。基于此,在开源数字地球模型上进行二次开发,采用GeoServer作为WebGIS服务器实现网络地图服务,构建一种金字塔模型的数据缓存机制,分析系统体系结构,设计基于数字地球的WebGIS。通过在WebGIS上水雨情信息综合集成和洪水淹没三维仿真的应用表明,该WebGIS具有较好的实用性和扩展性。  相似文献   

17.
AJAX技术在Web2.0模式开发中的应用研究   总被引:3,自引:0,他引:3  
AJAX是Web应用的新方法之一,基于AJAX技术的Web模型是目前比较热门的网站构架,它不但能使网上用户得到更好的体验,而且能够减轻服务器和带宽的负担。文章主要介绍了AJAX的概念和工作原理,并通过基于Web2.0模式的实例开发。证明其在网站开发上优于传统的Web模型。  相似文献   

18.
移动地理信息采集共享P2P Web Service平台   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于移动P2P Web Service的地理信息采集与共享平台MPPWS-GIGS(Mobile P2P Web Service Geography Information Gathering and Sharing),目标是充分利用移动终端天然的分布式特点,支持地理信息的P2P采集和共享功能;为了克服现有移动网络的漫游性、带宽的局限性,通过中心控制服务器,基于目前移动网络支持的网络协议(UDP/TCP),完成针对移动网络的终端管理、会话管理、服务管理等功能。  相似文献   

19.
针对Web应用的功能测试问题,提出一种基于用例和顺序图的Web应用建模与测试方法。使用统一建模语言(UML)将用例图分层地扩展为用例迁移模型(UCTM),利用顺序图自上而下描述UCTM中的每个用例,将顺序图自动转换为受限有向图(RDG)。为控制状态空间爆炸,提出约束消息覆盖准则(CMC)。结果表明,由RDG生成的测试用例能满足CMC,CMC可控制测试用例的数量。  相似文献   

20.
文章在分析Web日志的基础上,结合西华师范大学计算机学院WWW站点的访问日志,主要论述了在Web日志挖掘前所做的准备工作--数据预处理.数据预处理是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号