排序方式: 共有145条查询结果,搜索用时 93 毫秒
1.
2.
数据仓库中ETL技术的研究 总被引:42,自引:0,他引:42
作为数据仓库的关键部件,支持数据抽取,清洗,转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素,该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。 相似文献
3.
4.
5.
随着RFID技术的发展,RFID应用正无所不在。通过对RFID数据的深入处理和分析,可以发现更复杂的复合事件和隐含知识,从而有效地支持事件监控、事件预警等先进应用。由于RFID的特殊性,依靠现有的主动数据库技术和数据流管理技术难以实现高效的RFID事件检测和处理。分析了RFID数据的特点,归纳和总结了RFID复杂事件处理的最新技术,讨论了一些亟待解决的新问题,主要有RFID数据清洗方法、以数据为中心的检测技术、以事件为中心的检测技术,以及复杂事件处理系统等,并对今后的研究重点进行了展望。 相似文献
6.
一种可靠的数据仓库中ETL策略与架构设计 总被引:16,自引:0,他引:16
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。 相似文献
7.
8.
基于数据仓库的企业管理决策支持系统 总被引:9,自引:1,他引:8
本文首先讨论基于数据仓库的决策支持系统的优越性,给出一种实现模型。并就建立数据仓库的关键技术进行讨论。提出一种新的实现数据清洗和过滤的方法,并且比较数据立方体的三种存储模型,最后给出量化结果。 相似文献
9.
一种大数据量的相似记录检测方法 总被引:9,自引:0,他引:9
大数据量的相似重复记录检测是数据清洗中的一个重要问题,提出一种基于q-gram层次空间的聚类检测方法:它首先将数据映射成q-gram空间中的点,并根据q-gram空间中的相似性度量采用层次聚类方法将相似的重复记录检测出来.它克服了传统的“排序&合并”方法由于字符位置敏感不能将相似记录字符串排在邻近位置的不足和大数量外排序引起I/O代价过大的问题.理论分析和实验表明,方法不仅具有好的检测精度,且有好的伸缩性,能够有效地解决大数据量的相似重复记录检测. 相似文献
10.