首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
从Web上异质的、非结构化的数据中发现有用的知识或者模式,是目前数据挖掘研究中的一个重要内容.Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的有用模式和隐藏的信息.文章介绍了Web挖掘基本情况.在此基础上对基于Web的文本挖掘进行了分析研究,给出了一个基于Web的文本挖掘的结构模型图.在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型.它比传统的远程教育系统具有更大的发展前景.  相似文献   

2.
Web挖掘在现代远程教育中的应用   总被引:5,自引:1,他引:5  
梁开健 《微机发展》2005,15(8):101-104
从Web上异质的、非结构化的数据中发现有用的知识或者模式,是目前数据挖掘研究中的一个重要内容。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的有用模式和隐藏的信息。文章介绍了Web挖掘基本情况。在此基础上对基于Web的文本挖掘进行了分析研究,给出了一个基于Web的文本挖掘的结构模型图。在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型。它比传统的远程教育系统具有更大的发展前景。  相似文献   

3.
Web日志挖掘是目前Web挖掘研究的一个重点.针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨.并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题.  相似文献   

4.
针对当前Web日志数据信息越来越多的问题,传统的数据库管理系统无法对其进行有效的操作分析。采用数据挖掘技术对其进行研究,从数据挖掘的系统结构和数据挖掘的过程两个方面对数据挖掘进行描述;对Web日志挖掘的理论和过程进行了详细的分析;给出ID3算法的描述,并给出了部分核心的代码。  相似文献   

5.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

6.
Web使用挖掘技术研究综述   总被引:10,自引:0,他引:10  
Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程.该介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术;对将来Web使用挖掘领域的研究问题作了展望.  相似文献   

7.
Internet的迅猛发展及Web数据量的迅速膨胀为数据挖掘研究提供了丰富的资源.如何在这个巨大的、信息量无比丰富的信息空间提取所需的知识,是数据挖掘面临新的研究课题,Web挖掘是解决上述问题的一个途径.Web挖掘是数据挖掘技术在Web上的应用,介绍Web挖掘的特点,深入分析Web挖掘的分类,并详细阐述Web挖掘的发展应用.  相似文献   

8.
面向计算机审计的移动数据挖掘服务研究   总被引:2,自引:0,他引:2       下载免费PDF全文
对智能化在线审计需求的增加驱使审计系统能够支持多种多样的挖掘算法、能够通过Web界面甚至移动用户的手持设备来使用数据挖掘服务。基于移动数据挖掘服务的审计系统可允许审计师在更广泛的范围内查询、定位,并能在本地完成其挖掘工作的Web服务。这除了可降低网络带宽的需求,还从仅需支付软件使用费而无须考虑软件的购置、配置及培训成本中获得好处。在分析了数据挖掘服务的构造、发现、合成、移动之后,给出了一个基于移动数据挖掘服务的计算机审计框架模型。  相似文献   

9.
童蕙 《福建电脑》2007,(2):87-88
数据挖掘与万维网(WWW)是两个热门的研究领域,因此,两者结合的产物--Web挖掘--自然也就成为了当前的热门课题.Web数据挖掘包括Web内容挖掘,Web结构挖掘和Web使用挖掘三个研究方向.文中详细介绍了Web使用挖掘的体系结构及其技术,并介绍了它们在个性化站点中的应用情况.  相似文献   

10.
针对Web访问信息的特征和现有数据挖掘方法的局限性,提出将传统数据挖掘算法改进后扩展应用于电子商务环境,实现对Web访问信息进行深层次分析以获取商业智能的思路,从实际应用的角度设计了一个基于Web访问信息挖掘的应用模型,给出了若干关键技术实现的方法,并用改进后的FP-growth算法对电子商务客户访问数据进行兴趣关联规则挖掘实验,验证了挖掘模型的可行性和有效性.  相似文献   

11.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

12.
Web搜索结果挖掘的研究与应用   总被引:3,自引:1,他引:3  
王霞  杨炳儒 《计算机工程与应用》2003,39(14):187-189,207
Internet上的信息是日益增加的,为了简单地获取所需要的信息和共享Internet上的信息资源,就必须要找到好的Web挖掘方法,其中基于加权统计的Web挖掘方法是一种简单的容易实现的方法。文章重点介绍了基于加权统计的Web挖掘方法和元搜索引擎,并实现智能搜索引擎,文章着重说明了基于加权统计的Web挖掘方法及算法中所使用的数据结构。  相似文献   

13.
基于Web挖掘的智能门户搜索引擎的研究   总被引:31,自引:0,他引:31  
搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了Web挖掘的定义、分类和应用。最后,详细讨论了Web挖掘技术在智能搜索引擎的重要应用。  相似文献   

14.
数据挖掘在智能搜索引擎中的应用   总被引:5,自引:9,他引:5  
随着互联网的迅速发展,WWW上信息增长越来越快,传统搜索引擎已经不能满足用户的需求。将数据挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了数据挖掘的概念。最后,详细讨论了数据挖掘技术在智能搜索引擎中的重要应用。  相似文献   

15.
数据挖掘在Web智能化中应用研究   总被引:3,自引:9,他引:3  
分析了Web信息的特点和目前开发利用的局限,提出在Web上采用数据挖掘技术即Web挖掘,促进web智能化的观点。全面阐述了Web挖掘在Web智能化中的几个重要应用。指出Web挖掘是Web技术中一个重要的研究领域,是发现蕴藏在web上知识、区分权威链接、理解用户访问模式和网页语义结构的关键,它使充分利用Web大量的真正有价值的信息成为可能,为智能化Web奠定了基础。  相似文献   

16.
传统的网络信息检索技术如搜索引擎存在一些不足,一方面它只是将信息搜寻出来,不能发现隐藏在数据背后的知识;另一方面其采集软件在采集数据时缺乏人工干预,智能性不强,导致信息利用率不高.针对传统的Web搜索引擎存在的上述问题,结合Web文本挖掘、XML、BP神经网络在数据处理方面的长处,提出了一个具有一定智能的Web文本信息检索模型,以使其具有较高的信息利用率.  相似文献   

17.
Interval Set Clustering of Web Users with Rough K-Means   总被引:1,自引:0,他引:1  
Data collection and analysis in web mining faces certain unique challenges. Due to a variety of reasons inherent in web browsing and web logging, the likelihood of bad or incomplete data is higher than conventional applications. The analytical techniques in web mining need to accommodate such data. Fuzzy and rough sets provide the ability to deal with incomplete and approximate information. Fuzzy set theory has been shown to be useful in three important aspects of web and data mining, namely clustering, association, and sequential analysis. There is increasing interest in research on clustering based on rough set theory. Clustering is an important part of web mining that involves finding natural groupings of web resources or web users. Researchers have pointed out some important differences between clustering in conventional applications and clustering in web mining. For example, the clusters and associations in web mining do not necessarily have crisp boundaries. As a result, researchers have studied the possibility of using fuzzy sets in web mining clustering applications. Recent attempts have used genetic algorithms based on rough set theory for clustering. However, the genetic algorithms based clustering may not be able to handle the large amount of data typical in a web mining application. This paper proposes a variation of the K-means clustering algorithm based on properties of rough sets. The proposed algorithm represents clusters as interval or rough sets. The paper also describes the design of an experiment including data collection and the clustering process. The experiment is used to create interval set representations of clusters of web visitors.  相似文献   

18.
基于Web的文本挖掘   总被引:22,自引:1,他引:22  
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。在茫茫的信息海洋如何快速有效地获取所需要的信息,一直是困绕着网上用户的难题。而Web挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困绕。该文主要介绍了Web挖掘基本情况,并在此基础上对基于Web的文本挖掘进行了分析研究;给出了一个基于Web的文本挖掘的结构模型图。同时,在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型。它比传统的远程教育系统具有更大的发展前景。  相似文献   

19.
互联网上的数据规模大、种类多、变化快,而且越来越复杂。通过数据挖掘和分析,可以获取有潜在价值的信息。但是,传统的数据挖掘系统在数据存储和计算性能上存在瓶颈。通过使用云计算技术,设计了一个基于Hadoop架构的网页日志数据挖掘和分析平台来解决这个问题。同时,为了提高挖掘效率,为大规模网页日志挖掘实现了Apriori算法的并行化,并使用该平台验证了该行算法的效率。  相似文献   

20.
明德廷  李娟  尹怡欣 《计算机工程与设计》2007,28(9):1995-1997,2065
数据挖掘是从海量数据中发现有意义的模式和规则的一项关键技术.国内很少有商家使用数据挖掘来辅助商业决策.给出了基于Web Service的数据挖掘系统结构及实现方案;描述了一个基于Web Service的数据挖掘系统原型,进一步说明了所提出的系统结构具有较高的效率、可信度、可实施性和安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号