首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
Web日志数据中保存有大量用户访问信息,而Web日志挖掘就是对系统日志信息以及用户的注册数据等进行挖掘,以发现有用的模式和知识。首先介绍了Web日志挖掘的基本流程,然后介绍了电子商务中的日志挖掘,并着重分析了在模式识别中如何利用改进的关联规则算法来挖掘出用户频繁访问的路径和页面兴趣度,为个性化推荐系统模型提供了依据,从而证实了对Web日志数据进行挖掘具有很重要的现实意义。  相似文献   

2.
Web日志挖掘可以使我们发现Web用户潜在的使用规律和模式。为了将存在着缺失、错误、噪音的原始Web日志数据转化为可靠、完整、准确的用户访问事务数据库,数据预处理工作是十分关键和重要的一步。文章就Web日志挖掘的预处理模型进行了深入的研究,并将其应用到实际日志数据预处理中,得到了理想的结果。  相似文献   

3.
Web挖掘常常被分成Web内容挖掘、Web结构挖掘和Web使用挖掘三类。Web使用挖掘又称为Web日志挖掘,是指从万维网用户的导航行为中发现有价值的信息的一种数据挖掘技术。Web日志挖掘一般有4个步骤:数据预处理、挖掘过程、模式分析和知识发现。数据预处理是对网站日志文件中的数据进行整理,清洗不完全的、杂乱的、噪声数据;模式分析是指提取用户不感兴趣的信息,并找到用户感兴趣的模式的过程;知识发现是指从日志文件中收集并发现有用知识的统计。主要介绍Web日志挖掘与Web结构挖掘相结合来完成挖掘过程及其应用。  相似文献   

4.
Web用户访问多是匿名访问,Web日志挖掘的主要目标是从Web访问记录中抽取用户行为模式,通过分析挖掘结果理解用户的行为,从而改进站点的结构.Web日志挖掘第一步是进行数据预处理.数据预处理是Web页面分析中最耗时的阶段,首先研究了数据预处理的过程,包括数据清洗、用户识别、会话识别、路径补充.提出了一种路径补充的算法,...  相似文献   

5.
应用多维数据立方体开采Web日志的多维关联规则   总被引:3,自引:0,他引:3  
随着WWW应用的高速发展和广泛普及,在WWW民务器上收集了大量的Web日志,这些日志记录了Web用户对Web页面的每一次访问的过程,它是一种宝贵的信息财富.应用多维数据立方体开采Web日志的多维系联规则,可以掌握网络流量、理解用户访问模式,进一步地可利用这些信息来提高Web系统性能、促进对Web站点的系统设计,以及预测未来用户的数量和爱好;最终可以在日益发展的电子商务领域,指导企业明智地进行市场决策。  相似文献   

6.
基于兴趣度的Web用户访问模式分析   总被引:1,自引:0,他引:1  
吕佳 《计算机工程与设计》2007,28(10):2403-2404,2407
Web日志隐含了用户访问Web行为的动因和规律,如何有效地从中挖掘出用户访问模式是Web日志挖掘的重要研究内容.构造了User_ID-URL矩阵,矩阵元素为用户访问页面的兴趣度.应用经典的模糊C-均值聚类算法进行用户访问模式分析,通过在真实数据集上的实验,结果表明引入了用户兴趣度的日志挖掘算法是行之有效的.  相似文献   

7.
基于Web日志分析的Web QoS研究   总被引:4,自引:0,他引:4  
Internet的服务模式正由传统的数据通信与信息浏览向电子交易与服务转变,需要对不同的用户或HTTP请求提供区分服务和性能保证.本文通过对网络Web服务器日志中记录的大量用户信息进行Web日志分析,研究在Web服务器中及其系统中引入和实现Qos控制的机制和策略,了解用户习惯,提供个性服务,提高服务质量和效率.  相似文献   

8.
一种Web挖掘的框架   总被引:4,自引:3,他引:1  
随着Web信息量的增长,Web用户也迅速增长,如何在海量信息中找出用户需要的信息变得更加重要。基于Web服务器日志,分析在线用户的浏览行为,挖掘Web数据并找出用户的遍历模式已经成为一个新的研究领域。针对Web站点的结构,给出了一个Web挖掘的完整框架,允许在分析复杂的遍历模式时加入约束条件,然后对框架中算法的执行效率和执行准确性进行比较和分析,同时展望了Web挖掘的未来研究方向。  相似文献   

9.
由于现有的Web日志缺少明显语义,提出一种语义Web日志模型--SWLM,并给出基于该模型的网页和用户聚类算法.通过日志概念的语义距离定量计算来聚类网页和用户,奠定了Web个性化服务的基础.性能测试实验证明,该模型具有较好的整体性能,能有效地进行网页和用户聚类.  相似文献   

10.
Web日志挖掘预处理中的用户识别技术   总被引:14,自引:0,他引:14  
1 引言互联网技术和应用的迅速发展使得可以从因特网获取的信息量日益剧增,因此迫切需要一种新的技术从这些信息中快速、及时地发现有用的知识,提高信息的利用率。作为数据挖掘技术研究的一个重要领域,Web日志挖掘(Web LogMining)是从服务器日志文件内大量的用户访问记录中抽取有用信息的过程。通过对Web日志的分析,可以构造出用户的行为模式,对于分析改进网络性能、优化网站的设计和拓扑结构以及改善企业的市场营销决策等会有极大的帮助。当前Web日志挖掘领域的研究已取得了很大的进展,但是目前的研究重点大都集中于挖掘算法的设计、分析和改进,对日志文件预处理方法的研究相对较少,然而正确有效地对Web日志文件进行预处理,不仅有利于随后的挖掘算法分析,而且对于最终形成准确可靠的用户行为模式也是极为重要的。  相似文献   

11.
A common perception is that there are two competing visions for the future evolution of the Web: the Semantic Web and Web 2.0. In fact, Semantic Web technologies must integrate with Web 2.0 services for both to leverage each other's strengths. This paper illustrates how Semantic Web technologies can support information integration and make it easy to create semantic mashups. An intelligent recommendation system for tourism is presented to show the efficiency of our method. Through the ontology of tourism, the system allows the integration of heterogeneous online travel information. An integrated knowledge process is developed to guarantee the whole engineering procedure. Based on the Bayesian network technique, the system recommends tourist attractions to a user by taking into account the travel behavior both of the user and of other users. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

12.
Personalized Web search for improving retrieval effectiveness   总被引:11,自引:0,他引:11  
Current Web search engines are built to serve all users, independent of the special needs of any individual user. Personalization of Web search is to carry out retrieval for each user incorporating his/her interests. We propose a novel technique to learn user profiles from users' search histories. The user profiles are then used to improve retrieval effectiveness in Web search. A user profile and a general profile are learned from the user's search history and a category hierarchy, respectively. These two profiles are combined to map a user query into a set of categories which represent the user's search intention and serve as a context to disambiguate the words in the user's query. Web search is conducted based on both the user query and the set of categories. Several profile learning and category mapping algorithms and a fusion algorithm are provided and evaluated. Experimental results indicate that our technique to personalize Web search is both effective and efficient.  相似文献   

13.
支持个性化推荐的用户分类规则挖掘的研究   总被引:1,自引:0,他引:1  
提出了一种应用决策树分类技术进行用户分类的方法 ,通过对 Web会话文件的处理、赋予类标记及决策树分类过程 ,实现了根据访问模式对用户的分类 ,以便个性化推荐和指导能够针对不同类别的用户进行 ,从而提高 E- Ser-vices中个性化服务的质量 .还讨论了待分类数据集中条件属性的选择和决策属性的类标记问题 ,给出了应用分类规则进行推荐的过程  相似文献   

14.
基于客户端的网页预取模型   总被引:2,自引:0,他引:2  
提出一种基于客户端的网页预取模型。此模型以WPC方法为理论核心,WPC方法以客户端用户访问日志数据为依据,从中挖掘出Web用户的访问模式再通过提出的模式匹配算法进行网页预测,还提出基于Agent的Web预取系统具体应用WPC方法进行网页预取决策。此模型避免或简化了一般的网页预取模型对Web日志进行的复杂的预处理的一些步骤,其中包括数据净化,用户识别,用户会话识别和事务识别等,从而提高了预取效率。实验结果表明该模型能够达到较为理想的预取效果,具有较高的实用价值。  相似文献   

15.
The degree of personalization that a Web site offers in presenting its services to users is an important attribute contributing to the site's popularity. Web server access logs contain substantial data about user access patterns. One way to solve this problem is to group users on the basis of their Web interests and then organize the site's structure according to the needs of different groups. Two main difficulties inhibit this approach: the essentially infinite diversity of user interests and the change in these interests with time. We have developed a clustering algorithm that groups users according to their Web access patterns. The algorithm is based on the ART1 version of adaptive resonance theory. In our ART1-based algorithm, a prototype vector represents each user cluster by generalizing the URLs most frequently accessed by all cluster members. We have compared our algorithm's performance with the traditional k-means clustering algorithm. Results showed that the ART1-based technique performed better in terms of intracluster distances. We also applied the technique in a prefetching scheme that predicts future user requests.  相似文献   

16.
曾少宁  汪华斌 《测控技术》2016,35(5):95-100
分析了企业信息系统的Web用户界面开发特性,研究了当前主流前端框架的MVC(模型-视图-控制器)设计模式应用,针对Web前端开发需求及最佳实践方法,提出了一种符合MVC用户界面开发最佳实践的组件化Web用户界面建模方法.设计一套抽象和描述Web用户界面组件的UML(统一建模语言)概要文件,从界面数据模型、界面组件模型到界面交互模型等3个方面完成Web用户界面建模.以一个装修行业定制型ERP(企业资源计划)系统为例,通过用户界面建模实践,验证了本建模方法的可行性、易用性和有效性.  相似文献   

17.
针对根据目前网络信息检索存在的查全率和查准率低的特点,提出一种个性化的局部上下文分析方法,以提高Web信息检索的性能.该方法通过设计一种客户端的用户兴趣挖掘模型,同时将用户兴趣模型与局部上下文分析方法相结合,克服了局部上下文分析的缺陷.实验结果显示该方法能有效提高Web信息检索的查全率与查准率.  相似文献   

18.
Web日志挖掘中的数据预处理技术   总被引:7,自引:1,他引:6       下载免费PDF全文
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。  相似文献   

19.
Ajax技术在Web2.0网站设计中的应用研究   总被引:1,自引:0,他引:1  
Ajax是Web领域的前沿技术,这种技术提供了新的互联网交互模型,并扩展了Web应用的能力。文中在介绍Ajax技术的工作原理、分析比较Ajax工作模式与传统Web工作模式区别的基础上,运用Ajax技术实现了网页的动态加载,用户的请求能更为迅捷地得到Web应用程序的回应。这样就避免了在网络上频繁地重复发送那些没有更新过的信息。相对于传统的Web应用,Ajax技术在丰富客户端的表现能力、改善用户体验中,表现了强大的交互性能。其原因在于Ajax技术实现了客户端与服务器间的数据通信,并提供了两者间异步通信的能力,因而降低了网络传输的数据量,均衡客户端与服务器间的负载。从而体现了Ajax技术提高系统效率与优化用户界面的优良性能。  相似文献   

20.
The Web is a huge network composed of Web pages and hyperlinks. It is often reported that related Web pages are densely linked with each other. Finding groups of such related pages, which are called Web communities, is important for information retrieval from the Web. Several attempts have been made for the discovery of Web communities such as Kumar’s trawling and Flake’s method. In addition to the communities of related Web pages, there are communities of users sharing common interests. Finding the latter communities, which we called user communities in this paper, is also important for clarifying the behaviors of Web users. It is expected that the characteristics of user communities in the Web correspond to those in real human communities. A method for discovering user communities is described in this paper. Client-level log data (Web audience measurement data) is used as the data of users’ Web watching behaviors. Maximal complete bipartite graphs are searched from term-user graph obtained from the log data without analyzing the contents of Web pages. Experimental results show that our method succeeds in discovering many interesting user communities with labels that characterize the communities.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号