首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

2.
基于Web日志挖掘的客户访问兴趣分析   总被引:4,自引:0,他引:4  
数据预处理是Web日志挖掘中的一项关键技术,如何分析客户访问兴趣是Web挖掘中的一个重要研究课题。概述了Web日志挖掘的概念、方法和步骤,重点分析了数据预处理的主要步骤及其实现技术,考虑客户访问路径和浏览时间长度等因素,给出并计算分析了网站用户的访问兴趣的方法。汽修之家网站日志的实际测试结果表明了该方法的有效性。  相似文献   

3.
因Web的高度普及,Web所包含的信息越来越丰富。因用户的不同能够从Web搜索不同的信息。借助Web日志挖掘,利用聚类技术能够合理实施聚类,可完善网站、提升服务水平,促进网络营销。笔者将结合现有经验,重点探讨Web日志挖掘问题。  相似文献   

4.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

5.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

6.
网站个性化服务的研究   总被引:6,自引:0,他引:6  
利用Web数据挖掘技术,对用户未来的访问进行预测和推荐,是实现网站柔性个性化服务的研究方向之一.笔者通过对网站个性化服务相关技术的研究,改进了对Web服务器用户访问日志信息进行聚类分析的关联数据竞争聚类(competitive agglomeration for relation data,CARD)算法,并在此基础上构建了相应的实验模型.CARD算法是CA算法的一种改进算法,适合于处理没有明显特征的Web数据.试验是建立在真实的Web日志上的,实验证明该算法具有较好的聚类效果和适用度.  相似文献   

7.
Web日志挖掘技术在电子商务网站中的应用   总被引:1,自引:0,他引:1  
在电子商务网站中,可以根据客户的访问日志挖掘出有价值的信息,根据信息划分客户群体和发现潜在的客户,使网站可以提供个性化信息服务和开展有针对性的电子商务活动,从而提升业绩。Web日志挖掘是数据挖掘在web页面上的应用,文章对Web日志挖掘进行了介绍,给出了web日志挖掘的步骤和方法,对Web日志挖掘工具进行了分析,并介绍了其在电子商务网站中的应用。  相似文献   

8.
本文通过对目前教学网站的现状分析和Web日志挖掘技术的研究,提出了利用Web日志挖掘技术跟踪评估网上教学质量的方法,为提高网站教学质量和改进网站的内容提供了有价值的参考。  相似文献   

9.
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。  相似文献   

10.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

11.
构造语义Web服务工作流的模型   总被引:7,自引:0,他引:7  
随着Web服务数量的不断增加,为了实现对复杂业务流程的处理。通过将OWL-S/UDDI协调器应用到Web服务工作流的构造当中,提出了一种用于构造语义Web服务工作流的模型,并给出了相应的实现步骤。这个模型能够利用Web服务的语义描述自动地查找和匹配Web服务,实现Web服务工作流的自动构造。  相似文献   

12.
为解决信息检索时不同用户对搜索结果有不同期望的问题,提出了一种基于向量空间模型的个性化网页搜索算法.针对用户不同兴趣,利用用户画像能够更加全面地表示用户兴趣的特点,通过向量空间模型建立用户画像来表达用户兴趣,结合传统的网页排序算法得出最终的网页排序结果.对于不同用户可得到不同的网页搜索结果,排序靠前的网页中符合用户兴趣...  相似文献   

13.
随着Web技术的发展,基于Web应用系统已经变得越来越庞大和复杂,如何保证Web应用系统的准确性、可靠性和安全性已成为软件测试的一个重要课题。本文比较了几种软件测试模型优缺点,分析了基于Web应用系统的功能测试、性能测试,探讨了基于Web应用系统的安全性测试。  相似文献   

14.
为了解决网页篡改的问题,并对发生问题的web页面进行自动恢复.本文基于时间轮询技术与核心内嵌技术,设计并实现了一种网页防篡改系统.该系统能够实时的检测网页被篡改并进行实时阻断及后台恢复;系统能定时的对网站的文件进行扫描,并根据不同的扫描结果进行相应的处理.采用时间轮询技术与核心内嵌技术有效的弥补了采用一种技术带来的缺陷,保证网页的完整性及安全性,并且使网页的防护达到了实时性.  相似文献   

15.
在对现有主流网页消重技术分析的基础上,提出一种基于网页内容的改进的网页消重高效检测算法.该算法通过利用网页的标签树结构选取最大的多个文本块,将这些文本块连接在一起生成一个代表该网页的MD5指纹,对指纹进行比较,确认近似网页实现消重,实验证明该方法对近似网页能进行准确的检测.  相似文献   

16.
The details of a research study of galvanized steel tube under web crippling were presented. A total of 48 galvanized steel square hollow sections with different boundary conditions, loading conditions, bearing lengths and web slenderness were tested. The experimental scheme, failure modes, load-displacement curves and strain intensity distribution curves were also presented. The investigation was focused on the effects of loading condition, bearing length and slenderness on web crippling ultimate capacity, initial compressive stiffness and ductility of galvanized steel tube. The results show that web crippling ultimate capacity increases linearly with the increase of the bearing length under EOF and IOF loading condition. In the end-flange and ITF loading conditions, strain intensity of the centerline of web reaches the peak and decreases progressively from central web to flanges. Finite element models were developed to numerically simulate the tests in terms of failure modes and ultimate capacity. Web crippling strength of galvanized steel tube increases linearly with the increase of the ratio of the bearing length to web thickness and decrease of web slenderness. The effect of ratio of galvanized layer thickness to web thickness on web crippling strength is small. Based on the results of the parametric study, a number of calculation formulas proposed in this work can be successfully employed as a design rule for predicting web crippling ultimate capacity of galvanized steel tube under four loading and boundary conditions.  相似文献   

17.
论述了Web上的数据挖掘技术并作了分析和比较,对Web数据挖掘技术的应用也作了分析和展望.  相似文献   

18.
基于网页时间权值的PageRank算法改进   总被引:1,自引:0,他引:1  
针对PageRank搜索算法采用传统文献引文分析方法导致先后更新的网页没有有效给予权值的不足,提出一种改进的N-step PageRank搜索算法。新算法在原有网页优先级别的计算方法上加入网页时间权值,使对页面级别的计算更为合理。实验结果表明,新算法能够加强最新发布网页的重要性,优化网页的搜索排序。  相似文献   

19.
1 Introduction With the rapid growth of information on the W orld W ide W eb,the Internetis changing ourlife un- precedentedly.A lthough the Internetoffers a lotofin- form ation resources,the resources are open,dynamic and differen,twhich makes resourceso…  相似文献   

20.
随着网络技术的迅猛发展及其广泛应用,互联网正成为高效的信息发布渠道。为地理信息的网络传输与发布提供了一种崭新而有效的载体,地图网络发布正成为目前地理信息领域的研究热点。但地图网络发布的进一步发展面临看新的挑战。它需要寻求新的技术来解决系统开放性问题,XML作为一项新的网络技术,为地图网络发布带来了新的机遇。文章着重于新的硒络技术在地理信息领域的应用,对基于XML的地图网络发布技术进行了深入的研究,提出了基于GML的多源空间数据的集成模型,建立了多源空间数据到GML数据的转换引擎,解决了多源空间数据的集成和共享;提出了采用SVG来作为客户端地图的显示方案,建立了基于SVG的地图符号描述与管理方法。解决了空间数据在客户端的多样化显示与交互操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号