首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
Web数据挖掘综述   总被引:1,自引:0,他引:1  
Internet技术的发展和普及使信息获取和发布的方式发生了巨大的飞跃和本质性的变化,WWW成为信息传播的主要载体之一.如何从这些巨量的、分布的、异构的、半结构化的、动态的Web数据中发现有用的知识是数据挖掘和知识工程研究面临的新课题.本文综述了Web数据挖掘的基本概念、分类、应用,分析了Web挖掘的发展趋势.  相似文献   

2.
文章叙述Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

3.
随着Internet的迅速发展,使得“数据丰富而信息贫乏”这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

4.
基于Web的数据挖掘   总被引:4,自引:1,他引:4  
万维网的出现使计算机拥有海量的信息资源,而其中蕴含的知识却未能得到充分的应用,为此Web挖掘技术成为一项重要的研究课题.在深入分析Web上数据信息的特点基础上,着重从功能的角度给出一种用于Web数据挖掘的过程框架,并介绍了伴随数据挖掘的进行,相应的数据信息从web数据到知识模式的演进过程.利用这些Wed挖掘技术可有效挖掘信息.  相似文献   

5.
在当今的信息时代,搜索引擎是Web信息检索的主要工具,Web的数字挖掘技术逐渐成为了研究的热点.把Web数据挖掘技术与搜索引擎相结合,从而构建一个基于数据挖掘的搜索引擎原型系统,它能够以语义的、在线的、树型的和文本的方式对搜索引擎的搜索结果进行聚类,帮助使用者更容易和快速的找到相关信息.  相似文献   

6.
针对Web数据的异构性和非结构特征,提出一种最小开销的Web方面实体搜索方法:FacetedWeb.采用命名实体对Web进行结构化的标注,将无结构的Web数据建模为实体元组数据库以支持多类型的实体搜索和动态的方面选择.采用基于随机行走模型的概率排序算法,用结点的个性化PageRank值来衡量结果的相关性,以构造最小开销的方面接口.在真实Web数据集Clueweb上实现了FacetedWeb的原型系统,通过用户评测数据验证了FacetedWeb作为通用Web方面搜索引擎的有效性,并与传统实体搜索算法的进行对比,结果表明FacetedWeb在实体搜索的效率和精确度上具有明显的优势.  相似文献   

7.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

8.
卫星测试数据库查询、监视子系统的研究与实现   总被引:3,自引:0,他引:3  
随着Internet的发展,基于Web数据库的开发已经成为趋势。将卫星测试数据利用Web技术进行处理,可以更好的挖掘卫星数据的可利用性。据此设计了基于Web技术的卫星地面控制系统。系统详细介绍如何对已经接收的测试数据进行查询和分析,并向网络用户提供数据发布服务。用户能够通过本系统及时监视测试情况、采取相应的管理功能并能够对历史数据进行查询、统计。  相似文献   

9.
基于Web的数据挖掘技术及应用   总被引:1,自引:0,他引:1  
介绍了Web访问行为的数据挖掘,对Web数据挖掘的类型、数据源、过程及应用进行了研究和探讨,详细阐述了Web使用挖掘的挖掘原理和挖掘过程,可为实际应用参考.  相似文献   

10.
随着社会的信息化和各种媒体的数字化 ,Web数据挖掘逐渐成了一个研究热点。作者结合信息检索技术和数据挖掘技术设计并实现了Web信息聚类引擎系统 ,使其能够以语义的和在线的方式对搜索引擎的搜索结果进行聚类 ,从而使用户很容易地在WWW上找到自己真正需要的信息。  相似文献   

11.
随着Internet/Web技术的快速普及和迅猛发展,各种信息急剧增长,如何在Internet上发现有用信息成为数据挖掘研究的热点。本文通过对数据挖掘的步骤及其分类的分析,重点探讨了搜索引擎的技术构成、及其在网络数据挖掘中的应用。  相似文献   

12.
网络环境下数据挖掘若干问题的述评   总被引:2,自引:0,他引:2  
在深入分析Web上数据信息的特点的基础上,着重从功能的角度给出了一种用于Web数据挖掘的过程框架,并介绍了伴随数据挖掘的进行,相应的数据信息从Web数据到知识模式的演进过程。  相似文献   

13.
随着互联网的飞速发展,如何高效利用万维网这一巨大信息源,从中挖掘潜在的有价值的信息和知识,已成为国际学术界一个研究热点.传统的Web信息检索技术已无法满足人们日益增长的Web信息检索和挖掘需求,而网络挖掘技术可以弥补搜索引擎的不足.重点介绍一个网络挖掘原型系统WebME,包括其系统结构、主要功能和特点,并提出了进一步完善的一些设想.WebME采用了一些独特的网络挖掘技术,集多种网络挖掘功能于一体,是目前国内功能最为全面的网络挖掘系统之一.  相似文献   

14.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

15.
如何从网上海量信息中发现有用的知识,满足使用者的需要是一个迫切需要研究的课题.但现有的方法很难从Web上把大量非结构信息抽取到数据库中,而且一般的搜索引擎也只是简单地把关键字匹配作为查询依据,命中率较低.文章提出了将自然语言理解技术与Web数据挖掘相结合,根据用户的需要定制个性化的Web数据挖掘模型.初步试验结果表明该方案是可行的,能很好的满足用户需要,且模型的通用性和适用性强.  相似文献   

16.
通过对Web数据挖掘技术及其在电子商务中的应用进行了研究,发现传统的电子商务Web数据挖掘系统具有挖掘引擎封闭、难以对算法动态管理、挖掘结果难以重复利用的不足,本文提出了基于Web服务技术和移动Agent技术的适用于电子商务领域的Web挖掘系统的架构,此架构具有更好的跨平台性和更高的挖掘效率。  相似文献   

17.
万维网的出现使得计算机拥有了海量的资源,但也困扰着人们获取其中有用信息.W eb挖掘的应用为解决此问题指明了方向.对W eb挖掘的最新技术及发展方向进行了论述,包含W eb挖掘分类,W eb挖掘的特征和两个具体的W eb挖掘算法,最后提出一个具体的W eb挖掘系统SWMS模型.  相似文献   

18.
基于XML的智能信息检索与聚类研究   总被引:1,自引:0,他引:1  
目前Web上大多是非结构化的信息,检索主要是通过基于关键词的搜索引擎或目录浏览。近来,许多组织、团体、协会在Web上通过DTD/Schema定义XML(Extensible Markup Language)档,由于XML描述了结构化的信息,对XML文档的检索也与以往的搜索引擎不同。为此,本文设计了一个新的基于XML文档的智能信息检索原型系统XIIRC,给出了它的体系结构及功能,并对用户界面、索引机制、查询机制、检索结果概念聚类等问题进行了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号