共查询到17条相似文献,搜索用时 109 毫秒
1.
数据仓库环境下以用户为中心的数据清洗过程模型 总被引:7,自引:1,他引:7
数据清洗是数据仓库和数据挖掘中非常重要的一个环节。本文首先分析总结了数据清洗的有关概念,给出了数据清洗中需要解决的质量问题,并总结了解决这些问题的技术和方法。在此基础上提出了以人为中心的数据清洗过程模型。该模型集成了工作流技术、数据集成、数据转换和数据挖掘技术。给出了每个工具箱应该提供的基本功能。 相似文献
2.
数据抽取及语义分析在Web数据挖掘中的应用 总被引:4,自引:1,他引:3
把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,使数据提取更加准确。 相似文献
3.
基于政务数据仓库的数据集成及关键技术 总被引:3,自引:0,他引:3
政府机关网络中的数据集成是进行数据挖掘的准备阶段,这一阶段需要以行政决策为依据来抽取和集成数据并导入数据仓库。文章根据政府机关网络中已有数据的特点和数据挖掘过程中对数据的要求,详细讨论了构建数据集成的对象模型的方法、运用元数据库来实现致务数据仓库的数据集成的途径、使用对象模型来实施异构数据集成的关键技术。 相似文献
4.
一、引言数据库中的知识发现(Knowledge Discovery in Databas-es,KDD)有时又叫数据挖掘(Data Mining,DM),它的各项技术在各个领域得到了应用,并得到广泛的重视。建立数据仓库是数据挖掘工作的第一步。数据仓库被定义为面向主题、集成的、随时间变化的、数据稳定的,被用来组织决策的数据集合。数据仓库作为一个很重要的策略来为一个组织的从各种异构的信息来源进行结合,并进行在线分析(OLAP)以及数据挖掘。不幸,数据挖掘中的数据品质未得到人们的足够重视。实 相似文献
5.
把数据仓库、数据挖掘和可视化等大数据研究的关键技术应用到机场综合管理数据库建设中。利用数据仓库、数据挖掘和可视化等大数据研究的关键技术,实现机场在建设综合管理数据库过程中,各类型海量数据处理、数据仓库建设、数据的分析及价值发现。进而为机场建设综合管理数据库提供了设计方案。 相似文献
6.
数据仓库中数据质量控制研究 总被引:18,自引:1,他引:18
随着数据仓库的深入应用,数据质量问题成为关系到数据仓库建设成败和数据能否有效应用的重要关键问题。该文首先讨论数据仓库环境下存在的数据质量问题以及保证数据质量的重要性,然后提出数据质量的度量和评价指标,最后给出了数据仓库实施和运行过程中数据质量控制的数据质量成熟度模型和保证仓库数据质量的方法。 相似文献
7.
数据迁移工具的设计研究 总被引:5,自引:0,他引:5
数据迁移就是将数据从一种数据环境移入另一种数据环境中。它不仅仅是简单的数据搬家,还涉及到数据格式的转换。本文介绍了在Microsoft公司UDA技术基础上,利用SQL语句完成常用数据库数据间迁移的设计和实现流程。这一完整的数据流程如果定期发生,就可以频繁到实时数据转换或不频繁地每月为数据仓库进行更新,因此对于数据仓库的建立,以及后续的数据挖掘都有相当的实际价值,同时对于实用的应用程序更新也具有一定意义。 相似文献
8.
现阶段的数据挖掘研究工作主要集中于挖掘核心算法方面,忽视了对数据预处理的研究。本文将数据预处理无缝集成于数据仓库的构建过程中,提出了一种数据预处理过程模型,对企业成功实施数据挖掘应用做出了有益的探索。 相似文献
9.
国家自然科学基金委员会在促进科技进步方面正发挥着越来越多的作用。多年来,国家自然科学基金委员会产生大量的数据,为便于更好地管理和理解数据,建立数据仓库就非常有必要。利用面向对象的概念模型建立了国家自然科学基金委员会管理数据数据仓库,并通过数据仓库的建立以及面向科学基金管理数据的展示系统的建立验证了模型。 相似文献
10.
数据建模在数据仓库建设中的应用 总被引:2,自引:0,他引:2
数据仓库是国土资源决策支持系统建设中的核心内容,是决策支持系统处理的基础。建立数据仓库的目的,是把国土资源的内部数据和外部数据进行有效的集成,为各级决策领导、各级管理人员和业务分析人员使用。作者重点从数据仓库模型设计要点、国土资源一体化数据仓库整体模型架构、数据仓库模型设计规范三方面进行了详细设计。 相似文献
11.
运用高校学生成绩、学籍等相关数据,创建高校学生成绩分析的数据仓库,运用ID3算法实现基于学生成绩等级的决策树挖掘模型的构建,由决策树提取分类规则,并利用Analysis Services工具进行挖掘验证. 相似文献
12.
李岩 《电脑与微电子技术》2011,(17):53-55
数据仓库与数据挖掘是当今新的技术热点,数据仓库是一种解决数据使用的高效技术,数据挖掘为之提供更好的决策支持和服务,同时促进数据仓库技术的发展。主要介绍这两者的概念、应用,以及它们之间的关系。 相似文献
13.
数据仓库与数据挖掘是当今新的技术热点,数据仓库是一种解决数据使用的高效技术,数据挖掘为之提供更好的决策支持和服务,同时促进数据仓库技术的发展。主要介绍这两者的概念、应用,以及它们之间的关系。 相似文献
14.
根据POSC软件集成平台技术建立油气勘探数据仓库,并对基于油气勘探数据仓库的数据挖掘技术进行讨论。介绍了系统的总体结构,基于Epicentre的多维数据模型,数据完整性和一致性,探讨了数据挖掘技术在油气勘探中的一些应用。 相似文献
15.
基于数据仓库的数据采掘及其在决策支持系统中的应用 总被引:5,自引:0,他引:5
本文介绍了数据采掘技术的总体研究情况及有关的一些原型系统和商业产品。对数据仓库环境下数据采掘的特点和潜力进行了探讨。其次讨论了数据仓库技术的基本概念,提出了数据仓库的基本体系结构。最后给出了结合数据仓库、OLAP以及数据采掘技术的综合决策支持系统模型。 相似文献
16.
应用扩展元数据库方式解决数据仓库质量问题 总被引:5,自引:0,他引:5
数据仓库中数据的质量如何是直接关系到数据仓库系统成功与否的关键。扩展元数据库方式是解决数据仓库质量问题的有效方法。文章首先介绍了扩展元数据库,质量维度及质量模型,然后讲述了如何提高数据仓库中的数据质量,从而作为系统质量分析和质量驱动设计的基础。 相似文献
17.