首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 110 毫秒
1.
Web数据挖掘中数据集成问题的研究   总被引:3,自引:0,他引:3  
在分析Web环境下数据源特点的基础上,对Web数据挖掘中的数据集成问题进行了深入的研究,给出了一个基于XML技术的集成方案.该方案采用Web数据存取方式将不同数据源集成起来,为Web数据挖掘提供了统一有效的数据集,解决了Web异构数据源集成的难题.通过一个具体实例介绍了Web数据集成的过程.  相似文献   

2.
Web数据管理是研究如何根据动态的用户需求从动态的数据源中获取和管理Web数据.本文综述了近10年来该领域的相关文献,针对Web数据管理所必需的数据获取、数据管理和数据服务三大功能,对元搜索技术、数据空间以及跨媒体技术的研究现状和研究成果进行了总结和分析.最后,讨论Web数据管理系统中存在的问题,从数据质量、系统一致性维护以及个性化服务三个方面对未来研究进行了展望.  相似文献   

3.
Web日志挖掘是目前Web挖掘研究的一个重点.针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨.并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题.  相似文献   

4.
季薇 《福建电脑》2007,(12):56-57
本文对Web环境下的数据仓库进行了研究.首先指出利用Web上的数据决策支持服务的必要性,并针对HTML.XML的数据如何集成到数据仓库,Web环境下的数据仓库体系结构,查询处理以及几种具有代表性的Web数据仓库系统给出了解决方法.最后就相关问题的研究现状做了简要分析并加以展望。  相似文献   

5.
传统的Web模型不支持服务器端主动向客户端发送数据,这是基于Web的网管需要解决的问题。文章给出了一个由Web服务器、数据服务器、中间服务器、通信中间件以及应用服务器组成的管理服务系统模型,并详细讨论了基于VisualC++的系统设计与实现。  相似文献   

6.
Web日志挖掘数据预处理过程技术研究   总被引:11,自引:2,他引:11  
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。  相似文献   

7.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域,该文介绍了Web数据挖掘的基本概念,并给出Web数据挖掘的基本方法,最后指出Web数据挖掘的用途。  相似文献   

8.
基于Web服务和多Agent系统的分布式模型管理体系结构   总被引:1,自引:0,他引:1  
将Web服务技术应用于虚拟企业分布式网络环境下的模型管理研究,解决异地、异构的各个企业模型的集成和跨平台调用问题.设计了基于Web 服务的模型管理体系,给出了基于Web服务形式的模型转换与集成,设计了结合Agent技术的模型选择与调度方法,最后给出了Java语言形式的模型管理实现.  相似文献   

9.
Web数据仓库研究综述   总被引:4,自引:0,他引:4  
本文对Web环境下的数据仓库研究现状进行了综述。首先指出利用Web上的数据为决策支持服务的必要性,并针对半结构化数据如何集成到数据仓库、Web环境下的数据仓库体系结构、查询处理及几种具有代表性的Web数据仓库系统给出简要阐述。最后对相关问题的研究现状做了简要分析并加以展望。  相似文献   

10.
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用.介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码.  相似文献   

11.
Peer-to-Peer (P2P) systems have attracted much attention in academic commu-nity and industry circles due to their promising applications in various domains. This paper presents the authors‘ research efforts on introducing complex query capabilities in a P2P environ-ment consisting of numerous peers with large volume of data. An underlying hybrid P2P computing platform, named BestPeer is described first. The connection among peers within BestPeer is self-configurable through maintaining the nearest neighbor of peers, and the agent techniques employed in the system ensure its capability of providing sophisticated services. The designs of three P2P data management systems which are all based on BestPeer are described in detail. They provide support for information retrieval, query processing and Web services respectively. Advantages and limitations are discussed, while ongoing work is presented. Current systems can provide basic functions for keyword-based search, SQL-like query processing, and Web services querying and discovery. Some further topics on providing fully-fledged data management functionalities for P2P distributed computing systems with security guarantee are also discussed.  相似文献   

12.
使用Web Services技术可使多个信息源共同向客户提供信息,形成较理想的分布式应用。但源于多数据源的数据在格式上并不统一,如何处理这些异构数据成为需要解决的问题。UDDI是用于发现有用Web服务的技术,如果能将对异构数据源的描述信息加入其中,则有助于异构数据的处理。本文给出了一种可行的方法来实现这一目的,实验证明在基于Web的分布式系统中应用有较好效果。  相似文献   

13.
树和模板的文献信息提取方法研究*   总被引:1,自引:0,他引:1  
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。  相似文献   

14.
基于Web的数据挖掘技术   总被引:4,自引:0,他引:4  
对Web数据挖掘技术的国内外研究成果进行了评价.阐述了Web数据挖掘的流程及其特点,针对Web内容挖掘、Web结构挖掘、Web使用挖掘的方法及实现技术分别进行了讨论分析,介绍了Web数据挖掘的典型应用,并对该领域进一步研究的问题进行了展望。  相似文献   

15.
基于数据空间的概念,提出了一种新的Web数据管理方法:Web数据空间。阐述了Web数据空间概念及其特性。在此基础上,进一步从数据源的发现、模式匹配、数据模型、数据查询、数据演化、世系管理、群体协作与存储索引几个方面对Web数据空间相关研究工作进行了总结分析。最后讨论了Web数据空间研究面临的挑战与未来的研究工作。  相似文献   

16.
如何在信息量巨大的互联网上准确获取并长期跟踪用户关注的内容,是数据采集和挖掘的重要方面。探讨Web数据采集理论及其应用技术,给出一个半自动采集模型,设计基于旅游业数据的采集系统,验证数据半自动采集的可行性。  相似文献   

17.
基于Web的快速信息抽取   总被引:7,自引:0,他引:7  
介绍了一种基于Web的信息抽取的快速实现方法,该方法将信息抽取划分为两个阶段,在每个阶段采用不同的数据模型,对于半结构和无结构的信息抽取都有很好的效果。  相似文献   

18.
基于数据区域发现的信息抽取规则生成方法   总被引:2,自引:2,他引:0       下载免费PDF全文
提出一种自动检测网页中数据记录结构特点并生成Web信息抽取规则的方法,以网页DOM树为基础,自动发现和分离Web数据区域所对应的DOM子树,将其分解为数据记录子树集合,综合数据记录子树的结构特点生成抽取规则。实验结果显示,该方法具有较高的抽取准确率和查全率。  相似文献   

19.
网格是继Internet和Web之后第三次信息技术革命,最终将改变分布式资源的共享和服务方式。该文主要讨论了海量数据的产生、存储、处理,以及其对数据网格技术的需求,分析了欧洲数据网格和LHC计算网格的功能,并探讨了网格技术研究的最新情况。  相似文献   

20.
基于数据挖掘的煤矿安全信息管理模型的研究   总被引:1,自引:0,他引:1  
基于对数据挖掘技术、粗糙集理论、模糊逻辑与神经网络算法的分析,文章提出了一种基于数据挖掘的煤矿安全信息管理模型的设计方案。该模型应用Web服务器注册技术和XML数据合成技术形成终端数据库,采用数据挖掘技术中的粗糙集理论和模糊逻辑与神经网络算法形成终端数据仓库,并对终端数据仓库进行统一分析、管理和维护,有效地提高了煤矿安全信息管理的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号