共查询到20条相似文献,搜索用时 62 毫秒
1.
XML数据的灵活性、自描述性以及可扩展性使得越来越多的领域开始采用它作为主要的存储格式和传输媒介,因而产生了大量的XML数据,积累了丰富的信息。但是XML表述的数据特点比较复杂,这就为数据挖掘人员提出了新的挑战。文章从表述XML数据的模型开始介绍,按照模型对XML关联挖掘算法进行分类,介绍了主要的一些算法,并探讨了目前存在的问题和主要的发展方向。 相似文献
2.
3.
XML语言在Web数据挖掘中的应用 总被引:17,自引:0,他引:17
面向Web的数据挖掘是当今数据挖掘技术的热点,文章介绍了该项技术的特点所在,并详细阐述了XML语言的卓越性及其在Web数据挖掘中的重要应用。 相似文献
4.
在当今的信息化时代中,各种先进的网络技术都得到了不断的开发与应用.尤其是以XML为基础的Web数据挖掘技术,更是为网络信息技术的应用开启了一个新篇章.凭借着结构良好、层次性良好等的优势,XML语言已经被广泛应用到Web页面信息组织中,为数据挖掘提供了极大便利.本文便是对以XML技术为基础的Web数据挖掘技术进行分析,以... 相似文献
5.
Web数据挖掘中的数据预处理 总被引:11,自引:0,他引:11
Web数据挖掘是分析网络应用的主要手段,其数据源一般是网络服务器日志,然而日志记录的是杂乱的,不完整的,不准确的并且是非结构化的数据,必须进行数据预处理。文章将预处理过程分为3个阶段-数据清洗、区分使用者,会话识别,并提出了一个高效的Web数据挖掘预处理结构WLP和相应的算法。 相似文献
6.
7.
讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。 相似文献
8.
基于XML数据模型及面向Web数据挖掘技术 总被引:2,自引:0,他引:2
本文主要对Web上的数据结构特征及其数据挖掘技术进行分析,并就把XML作为一种半结构化的数据模型实施查询与模型抽取,从而完成面向Web数据挖掘的方法,且结合SQLSwrver2000的应用及实现智能查询应答的思想进行探讨。 相似文献
9.
10.
11.
新一代互联网Web2.0的普及和发展,对Web环境下的数据交换提出了更高的要求。文中首先分析了当前Web数据交换所面临的困难,接着介绍了XML技术及其优点,最后对XML在Web数据交换上的应用进行了说明。XML的推广和使用对于推动Web数据交换具有重要意义。 相似文献
12.
利用XML技术解决Web数据挖掘中数据异构的问题 总被引:1,自引:0,他引:1
讨论了Web数据挖掘中的数据异构问题,通过XML技术建立了一个半结构化数据模型和一个自动抽取模型,以解决Internet上绝大多数因异构、非结构化、动态数据集成问题所导致的Web数据挖掘的困难。 相似文献
13.
研究Web信息提取技术,提出数据获取、规则定义和规则执行3个步骤的基于XML的半结构化Web信息提取方法,为进一步满足Web信息提取提供了一种高效的新方法. 相似文献
14.
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。 相似文献
15.
XML Web服务安全技术纵览 总被引:10,自引:0,他引:10
基于XML技术的Web服务是一种崭新的分布式计算模型,基于一系列开放的标准技术,其松散耦合、语言中立、平台无关性、开放性使得它将成为下一代电子商务的架构,成为下一代的WWW。然而Web服务要被广泛地接受,要取得成功,其安全性是一个重要因素。该文介绍了Web服务的安全问题和现有的XML与Web服务安全相关技术的发展,并对其进行了展望。 相似文献
16.
利用XML技术进行Web内容挖掘 总被引:6,自引:0,他引:6
互联网的普及,人们频繁地在网络上寻找信息.如何有效地在Web上进行数据挖掘,成为研究的热点,而作为新一代互联网数据组织和交换的事实标准--XML,被提出用于Web数据挖掘,本文提出了一个基于XML的Web内容挖掘系统模型. 相似文献
17.
XML是连接Web和数据库的桥梁,针对B/S模型的Web数据库存在的不足,本文提出并构建了基于XML的Web数据库三层体系结构模型,并围绕网络购物系统的开发进行阐述。 相似文献
18.
随着计算机、数据库、网络等技术迅猛发展,不少单位构建了很多应用系统。这些系统大多是自行开发的,采用的数据库管理系统不相同,数据库的结构也不一致,造成各应用系统之间不能互通互联,无法实现共享,形成了一个个信息孤岛。因此,如何对异构数据格式进行有效的转换和整合已成为各类信息系统的必然选择。论文提出了4种基于XML和Web Service的异构数据整合的模型,为各单位的进一步的深入信息化工作奠定了基础。 相似文献
19.
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询。 相似文献
20.
在Web信息集成系统中,为解决数据源之间数据模型的异构性,提供一个有效的公共数据模型是一个常用的解决方法.在分析两种半结构化数据模型OEM和OIM的基础上,针对OEM模型表达XML文档存在的缺陷,将OIM的有向图结构与XML语言的相关特性相结合.提出了一种面向XML的公共数据模型XCDM.并补充了OIM对象代数的六种代数操作,XCDM充分考虑了XML语法表达的灵活性,可以为用户提供多级视图,完全符合公共数据模型的几点准则。 相似文献