首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于客户端的Web使用挖掘   总被引:4,自引:0,他引:4  
本文介绍了一种从客户端挖掘用户Web使用过程的特点、应用与方法,它是Web数据挖掘的一个重要组成部分。  相似文献   

2.
Web挖掘及其应用研究   总被引:7,自引:0,他引:7  
Web挖掘就是利用数据挖掘技术,从Web文档和Web活动中提取感兴趣的,潜在的有用模式和隐藏的信息,本文详细阐述了Web的特点,Web挖掘的分类及应用。  相似文献   

3.
基于XML的Web数据挖掘的研究   总被引:4,自引:1,他引:4  
1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就  相似文献   

4.
Web数据挖掘中的增量挖掘   总被引:5,自引:2,他引:5  
为了高效及时地处理频繁新增的数据,在Web挖掘中引入增量挖掘的方法,并给出了一个Web关联规则增量挖掘的有效算法。  相似文献   

5.
Web挖掘研究综述   总被引:25,自引:0,他引:25  
1 引言今天Web已成为信息发布、交互及获取的主要工具,Web上的信息量正以惊人的速度增加着,人们迫切需要能自动地从Web上发现、抽取和过滤信息的工具。同时,近年来,由于电子商务的快速发展,许多公司借助Internet进行在线交易,企业管理者需要分析大量的在线交易数据,从而发现用户的兴趣爱好及购买趋势,为商业决策风险投资等提供依据。具体来讲,当我们与Web交互时,常面临如下问题: 1.查询相关信息。这是查询触发的过程,我们希望从Web上找到关于VC~++编程指南的书,关于申办奥运会的信息,甚至关于爱滋病的报道等等。可以用搜索引擎如Yahoo Sohu等进行关键字查找,然而,今天的搜索引擎都有两个严重问题:低查准率会返回很多不相关的结果;低查全率有很多相关的文档找不到。  相似文献   

6.
Internet的迅猛发展,使其日益成为人们查找有用数据的重要来源。一般的搜索引擎是基于关键字的查询,命中率较低,且不能针对特定用户给出特定服务。提出了将自然语言理解技术与Web数据挖掘相结合,根据用户的特殊需求定制个性化的Web数据挖掘系统,给出了面向新闻挖掘这一特定领域的Web挖掘系统News-Miner的应用方案及设计实现。初步实验结果表明该方案是可行的。该方法可方便地扩展到其它专业应用领域。  相似文献   

7.
基于Web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。  相似文献   

8.
基于web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。  相似文献   

9.
Web数据挖掘   总被引:30,自引:4,他引:26  
王实  高文 《计算机科学》2000,27(4):28-31
Web Mining is an important branch in Data Mining.It attracts more research interest for rapidly developing Internet. Web Mining includes(1)Web Content Mining;(g)Web Usage Mining;(3) Web structure Mining.In this paper we define Web Mining and present an overview of the various research issues,techniques and development efforts.  相似文献   

10.
Web数据挖掘   总被引:52,自引:1,他引:51  
王实  高文 《计算机科学》2000,27(4):28-31,41
1 引言当前WWW正在深度和广度方面飞速地发展着,Internet也正在前所未有地改变我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、Web站点的导航设计、电子商务等工作正变得越来越复杂和越来越繁重。从站点经营方来说,他们需要好的自动辅助设计工具,可以根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务以更好地满足访问者的需求。从访问者来说,他们希望看到的是个性化的页面,希望得到更好的满足各  相似文献   

11.
Web文本挖掘技术研究   总被引:221,自引:1,他引:220  
作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web挖掘正悄然兴起,倍受关注,目前,Web挖掘的研究正处于发我统一的结论,需要国内外学者在理论上开展更多的讨论,同时,Web挖掘系统的开发对其研究也将起到很大推进作用,首先探讨了Web挖掘的有关理论,从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述,然后重点分析了  相似文献   

12.
基于Web使用挖掘的思想,通过在Web日志文件中加入用户页面动作记录,结合浏览页面和页面行为两方面的内容,设计算法计算支持度计数,进行关联规则挖掘,力图提取更加准确的用户购买模式;参照这些模式,利用一种混合模式算法对Web站点匿名访问用户的购买概率进行预测,建立预测模型,并给出了实验结果分析.提出的模型对企业的客户关系管理具有积极的意义.  相似文献   

13.
Web应用的深入使N层体系结构的系统逐渐被广泛使用,同时网上的海量信息也为Web挖掘提供了一个广阔的应用领域。本文针对在N层体系结构中应用Web挖掘技术进行了研究;包括在N层体系结构中实现网站用户访问分析、智能搜索引擎和个性化推荐等;对数据源的处理和转换、数据仓厍的建立和使用以及业务处理过程的改进等都进行了论述。  相似文献   

14.
数据仓库与数据挖掘研究进展   总被引:17,自引:0,他引:17  
随着数据库应用从以事务处理为中心逐渐向以分析处理为中心转化,以数据仓库、联机分析和数据挖掘为中心的基于数据库的分析技术成为近几年来数据库界研究的热点。经过近十年的研究与应用。已经产生了很多的研究成果,建立了较扎实的理论基础,目前正在向与应用领域紧密结合(如流数据)。对现有技术进一步改造方面发展。本文对近两年这几个方向上的研究成果进行了总结。  相似文献   

15.
企业的Web日志中蕴藏着丰富的信息.首先从企业绩效的角度出发,提出以企业营运能力的绩效评价为目标的Web被访信息的空间存储模型,模型中存储了访问时间序列、访问轨迹和评价指标等信息;然后将绩效评价体系的理论、基于Web的信息技术、数据挖掘技术集成,利用关联规则挖掘算法实现对因特网内的大范围Web日志的内容分析和主题挖掘,建立了基于Web挖掘的企业绩效方法.该模型为企业进行绩效评价提供了一种新思路.  相似文献   

16.
基于分布式的Web log挖掘模型   总被引:1,自引:0,他引:1  
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。  相似文献   

17.
Semantic Web研究综述   总被引:10,自引:0,他引:10  
近年来,Semantic Web逐渐成为WWW领域的研究热点以及智能化网络服务和应用开发中的关键技术之一。归纳了Semantic Web技术的研究背景和主要发展历史。在分析了典型的Semantic Web概念后,给出了Semantic Web的定义。通过讨论Semantic Web构想的层次框架模型,指出了各个层次扮演的角色,并着重分析了Semantic Web的重要研究领域,指出了它们在Semantic Web构架中的核心作用。通过分析Semantic Web的应用领域和相关开发工具以及面临的问题和挑战,指明了Semantic Web研究和实践的方向。作为总结,给出了Semantic Web领域下一步的研究趋势。  相似文献   

18.
一种基于Web数据挖掘的ICRM系统设计与实现   总被引:1,自引:0,他引:1  
该系统利用Web数据挖掘技术获取客户供给信息、客户需求信息、客户咨询信息,再结合企业自己的综合数据库,并在Internet上利用email、短信等方式,来满足客户的需要,进行相应的客户关系管理。  相似文献   

19.
Web个性化技术研究综述   总被引:1,自引:0,他引:1  
Web个性化是近年出现的一个重要研究方向,它是Web使用挖掘和信息技术在新的Web和Internet环境下相互融合的产物.首先讨论了Web使用挖掘及个性化的概念、研究内容和核心技术,然后对Web使用挖掘的关键技术进行了综述,包括数据采集与预处理、模式发现、语义Web与个性化等,并给出了它们的研究重点和发展方向,最后是个性化系统的研究展望和面临的挑战.  相似文献   

20.
在分析现有挖掘用户频繁路径技术不足的基础上提出算法MUFPS(Mining User Frequent Paths based on Supportability).该算法主要通过用户会话文件计算出所有被请求页面各自的支持度总和,并结合Web站点结构挖掘出该用户的频繁访问路径.通过实验对比证明该算法能有效地提高挖掘效率,同时保证了挖掘结果的准确性和可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号