首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
点击流中事务数据模型的设计与实现   总被引:1,自引:0,他引:1  
点击流数据简单说就是Web服务器上一系列有序的日志记录。随着WWW应用及电子商务的高速发展,电子商务网站的Web服务器上自动收集了大量的用户访问信息记录,即所谓的Web日志。Web日志蕴涵了大量的有用信息,如客户来源、客户访问趋势、客户兴趣、网站流量等,因而记录和分析Web日志数据已逐渐成为e企业的一项重大活动。点击流数据仓库对原始的Web日志数据进行过滤、清洗并集成,以便于利用联机分析处理和数据挖掘技术对点击流数据做进一步分析,从而为企业创造巨大的信息财富。  相似文献   

2.
具有访问时间完整性的Web日志方法   总被引:4,自引:0,他引:4  
Web服务器日志记录了外部用户对本服务器的访问信息,是分析网站的重要数据。但是根据当前流行的几种Web日志格式来看,它们所记录的时间数据并不完整;当用户访问一个网页时,只记录了访问该网页的开始时间,而没有记录访问结束时间。这将造成访问信息的丢失,给今后的分析工作(如访问时间统计、用户会话识别等)带来困难。本文提出了一种Web日志方法,它能克服目前Web服务器日志的这一缺点,记录完整的时间信息.  相似文献   

3.
Web日志数据中保存有大量用户访问信息,而Web日志挖掘就是对系统日志信息以及用户的注册数据等进行挖掘,以发现有用的模式和知识。首先介绍了Web日志挖掘的基本流程,然后介绍了电子商务中的日志挖掘,并着重分析了在模式识别中如何利用改进的关联规则算法来挖掘出用户频繁访问的路径和页面兴趣度,为个性化推荐系统模型提供了依据,从而证实了对Web日志数据进行挖掘具有很重要的现实意义。  相似文献   

4.
随着网络技术的发展,人们对网络的依赖性越来越强,但同时网络攻击给网络用户造成了严重的信息泄露和巨大的经济损失。如何从浩瀚的用户访问信息中发现对网站具有恶意攻击行为的用户就成为了Web服务管理者亟需解决的重要问题。对Web服务日志的深入分析后,发现攻击访问用户与正常访问用户在访问Web服务时形成的日志记录具有不同的特征。通过特征提取并且进行必要假设后,利用朴素贝叶斯分类算法构建异常检测分类模型,取得了较好的检测效果。  相似文献   

5.
基于用户访问兴趣的路径聚类研究   总被引:1,自引:0,他引:1  
网站可以通过关注用户访问路径、访问某个页面的时间、在此页面的驻留时间以及由那个链接到此页面的URL等信息,利用聚类技术将具有相同兴趣的用户分类。文章将介绍一种新的基于用户访问兴趣的路径聚类算法,其中定义了新的兴趣度、相似度、及聚类中心。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。  相似文献   

6.
通过对电子商务中服务器上的日志文件等Web数据进行客户访问信息的分析,重点研究了客户分析系统的数据采集、数据处理以及跟踪客户在Web上的浏览行为并进行模式分析,并构建了用户访问模式的挖掘模型及算法的分析与实现。  相似文献   

7.
用户访问路径是Web用户聚类时度量用户兴趣度的参数之一。结合日志记录的特点,从参数的数学特征出发,设计一种基于二进制数表示的访问路径矩阵来度量用户的兴趣度,并给出新的相异度矩阵构造法。实验表明,所提出的访问路径矩阵是可行的,生成的相异度矩阵在表现用户访问路径差异上是准确的。  相似文献   

8.
通过结合网站设计初期的网站结构和典型用例的预先定义,构建一个基于Web日志数据的用户访问数据分析系统。该系统(AS-UAB,Analysis System of User Access Behaviors)通过对网站结构和典型用例的预先植入,利用该领域最新的研究方法和结论,为网站相关人员提供可视化的用户访问信息统计及趋势预测,网站结构设计及交互设计上存在的问题及改进建议等通用功能和个性化定制功能。  相似文献   

9.
近年来,Web使用挖掘成为数据挖掘领域中一个新的研究热点,Web使用挖掘是从记录了大量网络用户行为信息的Web日志中发现用户访问行为特征和潜在规律.本文结合某高校主页的真实运行数据,通过Web使用挖掘对于网站的运行日志文件进行全面的挖掘分析,分析用户对信息内容的兴趣度,并通过用户对网页的访问数据推算出各个页面受众的兴趣度高低,借此改良网站的内容和布局.  相似文献   

10.
本文先将原始Web日志进行预处理,即时Web日志进行数据清洗,用户识别,会话识别和格式转换等.再用蚁群聚类算法对预处理后的日志进行聚类分析,提取具有代表性的用户访问模式,最后用协同过滤推荐技术向网站访问者进行推荐,提供个性化服务,从而实现网站的个性化推荐.  相似文献   

11.
The paper proposes an adaptive web system—that is, a website that is capable of changing its original design to fit user requirements. For the purpose of improving shortcomings of the website, and also to make it much easier for users to access information, the system analyzes user browsing patterns from their access records. This paper concentrates on the operating-efficiency of a website—that is, the efficiency with which a group of users browse a website. By achieving high efficiency, users spend less operating cost to accomplish a desired user goal. Based on user access data, we analyze each user's operating activities as well as their browsing sequences. With this data, we can calculate a measure of the efficiency of the user's browsing sequences. The paper develops an algorithm to accurately calculate this efficiency and to suggest how to increase the efficiency of user operations. This can be achieved in two ways: (i) by adding a new link between two web pages, or (ii) by suggesting to designers to reconsider existing inefficient links so as to allow users to arrive at their target pages more quickly. Using this algorithm, we develop a prototype to prove the concept of efficiency. The implementation is an adaptive website system to automatically change the website architecture according to user browsing activities and to improve website usability from the viewpoint of efficiency.  相似文献   

12.
基于用户访问事务文法的序列关联规则发现   总被引:4,自引:0,他引:4  
王实  高文  李锦涛 《软件学报》2001,12(10):1503-1509
在Web挖掘中,应用关联规则发现方法可以发现Web页面之间用户访问的关联度.由于Web站点内含丰富的页面结构信息,也由于用户的访问总是要遵循一定的访问顺序,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法.该方法首先得到用户访问事务;然后根据正则文法,定义了一种新的用户访问事务文法,用于从用户访问事务中得到用户序列访问事务;最后应用关联规则发现算法进而发现序列关联规则.为了进一步评价所发现的序列关联规则,引入了互信息的概念.发现的序列关联规则可以帮助Web站点的设计者更好地理解用户的访问,以用于调整Web站点的结构.  相似文献   

13.
随着互联网的快速发展,Web上的数据飞速增长。面对海量的数据,如何从中找出有价值的信息,运用到商业决策的制定中,已经成为越来越多的人关心的课题。该文主要介绍了web数据挖掘的概念和分类,论述了在电子商务中web挖掘的过程和方法,揭示了数据挖掘在电子商务中广泛的应用前景。论文实现了一个面向多电子商务平台的数据挖掘系统,系统面对多电子商务平台,实现了统一的数据收集和预处理过程,对用户的访问日志进行分析,从网站、商品类别、商品等角度进行数据分析,并又对用户的访问数据进行挖掘,从这些数据中发现潜在的规律,把握用户动态,帮助企业制定商业决策,使电子商务更具个性化和针对性。  相似文献   

14.
该文介绍了Web使用挖掘流程及所采用的数据挖掘技术,通过对Web使用模式挖掘结果的分析,探讨Web使用挖掘在电子商务网站设计优化中的应用,使网站设计更加符合用户需求,从而促进企业电子商务活动的发展。  相似文献   

15.
To attract and keep people at a web site is one of the major challenges in electronic commerce. More advertising, providing more useful information, or designing more flashy pages cannot prevent the Internet surfers from getting lost in the huge amount of information, especially the electronic catalogues. One solution is to customize the website for each for individual user through the analysis of preferences and interests in the user profile. The site should be able to customize itself on information content, information organization and information display. Information collection, analysis, and customization form a process to improve and customize the web site for each user, without Webmaster interference in normal operation. In this paper, a Personalized Electronic Catalogue (PEC) System is proposed to synthesize the customization of information content, organization, and display for electronic catalogs. An industrial application is used to demonstrate the improvement of information access for electronic catalogs.  相似文献   

16.
基于Web日志挖掘的个性化推荐技术已在电子商务网站中广泛应用,针对现有推荐系统的准确性不高等问题,提出一种基于Web日志挖掘和相关性度量的个性化推荐系统. 首先,提取用户的访问日志,并对其进行预处理,以获得精简的结构化数据. 然后,对日志进行分析,提取出特征序列. 再后,根据特征的出现频率和页面停留时间,计算出页面与交易文本文档的相关性. 最终,利用夹角余弦公式计算出用户与页面的相关性,并以此形成推荐列表. 实验结果表明,该方案能够根据用户偏好精确的给出个性化推荐.  相似文献   

17.
对网站页面中大量有规律的数据信息进行采集和利用,用人工来做将十分烦琐。如果能根据网站页面信息的特有规律编写出软件,自动获取所需信息,再加以利用将会事半功倍。  相似文献   

18.
Company websites are an important instrument for relationship marketing activities. We present a methodological framework that aligns website performance assessment and marketing intelligence for evaluating the performance of relationship marketing activities. In this context, we develop an extended web mining approach that integrates managerial perspectives in the analyst’s investigation of the customer-website interaction based on historical clickstream data.This approach enables quantification of the moderating effect of a website’s structure and content regarding website-based relationship marketing. The applicability of our approach is demonstrated by clickstream data of 477,471 visitor sessions on a software developer’s website. The results provide detailed insights into the usage behavior on a website and the mechanisms to enhance e-commerce efficiency via website optimization.  相似文献   

19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号