首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
顾客在Web上的行为留下的数据包含了对市场分析及预测非常有益的潜在信息.本文分析了在Web上应用数据挖掘技术分析此类信息的重要性,并给出了Web上数据挖掘技术的应用方案.  相似文献   

2.
基于Web的数据挖掘技术的研究   总被引:1,自引:0,他引:1  
基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究主题。本文介绍了Web上数据信息的特点入手.研究面向Web的数据挖掘需解决的主要问题,提出了一种基于Web数据挖掘的应用模式框架,并着重从功能的角度介绍了Web数据挖掘的演进过程。  相似文献   

3.
Web数据挖掘分析   总被引:1,自引:0,他引:1  
国际互联网的广泛应用使得数据挖掘技术在Web数据挖掘得到了最大的发展,文章就Web数据挖掘技术的存储数据源、分类、实现技术作了详细的阐述,并介绍了一些实用的Web挖掘工具,对Web数据挖掘进行了探讨和分析,并指出了国内外的发展趋势和待解决的问题。  相似文献   

4.
数据挖掘在Web中的应用研究   总被引:2,自引:0,他引:2  
徐甜  田有贵 《福建电脑》2006,(9):162-163
Web挖掘是一种新的研究领域,它涉及到机器学习、数据挖掘、自然语言处理、数据库等技术。本文介绍了数据挖掘的概念、常用技术和方法,讨论了数据挖掘技术在Web的应用。  相似文献   

5.
国际互联网的广泛应用使得数据挖掘技术在Web数据挖掘得到了最大的发展,文章就Web数据挖掘技术的存储数据源、分类、实现技术作了详细的阐述,并介绍了一些实用的Web挖掘工具,对Web数据挖掘进行了探讨和分析,并指出了国内外的发展趋势和待解决的问题。  相似文献   

6.
随着互联网的高速发展,Web挖掘由于其独特的优点,在电子商务的应用中扮演了越来越重要的角色。文章主要介绍了web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘在电子商务中的具体应用。  相似文献   

7.
Web挖掘及其在电子商务中的应用研究   总被引:1,自引:0,他引:1  
林瑞娟  侯德文 《微机发展》2006,16(8):186-188
作为一种崭新的信息处理技术,Web挖掘受到了人们极大的关注。电子商务是一种新型的现代商务模式,如何将Web挖掘应用于电子商务,来有效地处理信息,成为企业共同关注的问题。文中介绍了Web挖掘的概念和分类,阐述了Web挖掘在电子商务中的挖掘方法和过程,讨论了Web挖掘在电子商务中的典型应用,并就一个事例进行了具体的分析。  相似文献   

8.
Web挖掘及其在电子商务中的应用研究   总被引:4,自引:0,他引:4  
作为一种崭新的信息处理技术,Web挖掘受到了人们极大的关注。电子商务是一种新型的现代商务模式,如何将Web挖掘应用于电子商务,来有效地处理信息,成为企业共同关注的问题。文中介绍了Web挖掘的概念和分类,阐述了Web挖掘在电子商务中的挖掘方法和过程,讨论了Web挖掘在电子商务中的典型应用,并就一个事例进行了具体的分析。  相似文献   

9.
由于Web数据所具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘.基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘.文中综述了基于Web的数据挖掘技术,并且介绍了一种全新的技术XML.XML的推广和使用,对于推动Web挖掘和知识获取具有重要的意义.如何进一步的开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究.Web数据挖掘的研究具有极大的挑战性同时又具有极大的开发潜力.  相似文献   

10.
基于Web的数据挖掘技术   总被引:10,自引:0,他引:10  
陈二忠  姜丽华 《微机发展》2003,13(12):61-64
由于Web数据所具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。文中综述了基于Web的数据挖掘技术,并且介绍了一种全新的技术XML。XML的推广和使用,对于推动Web挖掘和知识获取具有重要的意义。如何进一步的开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性同时又具有极大的开发潜力。  相似文献   

11.
Web日志挖掘是目前Web挖掘研究的一个重点.针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨.并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题.  相似文献   

12.
针对Web访问信息的特征和现有数据挖掘方法的局限性,提出将传统数据挖掘算法改进后扩展应用于电子商务环境,实现对Web访问信息进行深层次分析以获取商业智能的思路,从实际应用的角度设计了一个基于Web访问信息挖掘的应用模型,给出了若干关键技术实现的方法,并用改进后的FP-growth算法对电子商务客户访问数据进行兴趣关联规则挖掘实验,验证了挖掘模型的可行性和有效性.  相似文献   

13.
吴小竹  陈崇成 《计算机工程与设计》2007,28(15):3563-3565,3620
提出了一种新颖的数据挖掘系统的体系结构,该结构把SOA与传统的挖掘系统结构相结合.在此体系结构的基础上,实现了一个开放式挖掘系统,能够动态集成挖掘算法.将该系统应用于福州地热资源的数据挖掘中,结果证明通过将WebServices技术引入数据挖掘系统的构建中,能大大增强挖掘系统的功能.  相似文献   

14.
增量式挖掘方法有适应大规模动态数据、降低内存需求和可实现并行处理等诸多好处,但是目前的增量式聚类方法存在参数限制较多和计算结果不够准确等问题.在信息源变化的数据挖掘体系结构下,利用一群特殊的智能代理增量修改知识模型,提出了群体智能聚类模型的构建方法及增量模型维护算法.该方法利用信息熵加快聚类过程,根据信息素和数据库的插入及删除增量操作调整已生成的聚群,设定的参数较少,实验表明聚类结果准确.  相似文献   

15.
朱德利 《计算机工程与设计》2006,27(23):4447-4449,4460
XML适合于解决Web数据挖掘中数据库环境异构和信息的半结构化等难题。Web结构挖掘是整个Web信息挖掘的重要组成部分。用XML来完成Web结构信息的预处理是将Web结构信息规范化并转化为XML数据,并以此明确网站的文件构成、组织方式、内容构成和内容的超链关系。提出基于XML的Web结构挖掘系统的实现过程,解决了XML文件通过标准接口读入到挖掘程序的关键技术。  相似文献   

16.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

17.
企业智能化Web商务数据挖掘引擎算法设计与实现   总被引:4,自引:0,他引:4  
针对现有的数据挖掘引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用的智能化Web商务数据挖掘引擎.从总体上给出了模型框架,得出企业智能化Web商务数据挖掘引擎是一个基于多模型的系统的结论.接着分别详细研究了该引擎的:Web内容挖掘、Web信息获取、客户行为挖掘3个核心模块.并给出了3个模块的详细算法设计和实现过程  相似文献   

18.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

19.
Web日志挖掘中数据预处理技术的研究   总被引:2,自引:0,他引:2  
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别.提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法.  相似文献   

20.
In recent years, the deep web has become extremely popular. Like any other data source, data mining on the deep web can produce important insights or summaries of results. However, data mining on the deep web is challenging because the databases cannot be accessed directly, and therefore, data mining must be performed by sampling the datasets. The samples, in turn, can only be obtained by querying deep web databases with specific inputs. In this paper, we target two related data mining problems, association mining and differential rulemining. These are proposed to extract high-level summaries of the differences in data provided by different deep web data sources in the same domain. We develop stratified sampling methods to perform these mining tasks on a deep web source. Our contributions include a novel greedy stratification approach, which recursively processes the query space of a deep web data source, and considers both the estimation error and the sampling costs. We have also developed an optimized sample allocation method that integrates estimation error and sampling costs. Our experimental results show that our algorithms effectively and consistently reduce sampling costs, compared with a stratified sampling method that only considers estimation error. In addition, compared with simple random sampling, our algorithm has higher sampling accuracy and lower sampling costs.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号