共查询到20条相似文献,搜索用时 250 毫秒
1.
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型.对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程.利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题.通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性. 相似文献
2.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。 相似文献
3.
XML本身具有与平台无关、易于扩展、自描述、语义性强等特点,能方便地描述结构化或非结构化的数据,而成为异构数据集成中描述公共模型的最好选择。基于XML数据模型,根据目录服务的思想,采用P2P技术进行信息资源的集成与管理,并据此设计一个异构数据交换与共享系统的方案。 相似文献
4.
基于Web的数据整合与发布系统的设计与实现 总被引:4,自引:0,他引:4
根据对企业中数据存储多样化与数据模式的分析,设计并实现了一个应用集成的、高效的、基于Web的数据整合与发布系统.该系统很好地解决了企业中结构化数据与非结构化数据的综合应用,并且集成了重要的企业应用。 相似文献
5.
已有上市公司财务困境预测模型主要是基于结构化数据进行研究,为进一步提高上市公司财务困境预测模型准确率,本文将非结构化数据引入上市公司财务困境预测问题中,研究了基于新闻文本分类的上市公司财务困境预测模型,结合新闻文本信息和财务信息提出上市公司财务困境组合预测模型。本文首先将新闻数据进行预处理,然后基于新闻文本数据通过支持向量机(SVM)进行财务困境预测,同时基于财务数据通过Logistic模型进行财务困境预测,最后采用阈值表决集成策略整合两种模型的预测结果,实验结果证明了模型的有效性。 相似文献
6.
7.
复杂政务信息资源的开发与利用成为制约智慧城市建设的重要因素。基于政务信息资源条块分割的现状,以信息检索为核心提出面向城市多级政务应用的信息集成检索方法。针对异构政务信息资源整合的要求,引入大数据、社交网络等技术理念重构政务信息资源的基础模型,建立非结构化、结构化两类数据的集成检索框架。对所述方法进行了原型验证,实验仿真结果表明了该算法在大数据并发环境下的有效性。 相似文献
8.
利用XML技术解决Web数据挖掘中数据异构的问题 总被引:1,自引:0,他引:1
讨论了Web数据挖掘中的数据异构问题,通过XML技术建立了一个半结构化数据模型和一个自动抽取模型,以解决Internet上绝大多数因异构、非结构化、动态数据集成问题所导致的Web数据挖掘的困难。 相似文献
9.
HyDB:集成MapReduce和数据库的高效SaaS架构 总被引:1,自引:0,他引:1
随着数据的快速增长和云计算的兴起,软件作为服务(SaaS)标志着计算机系统按需服务的应用的兴起.高效经济SaaS使得许多企业将大规模数据分析服务从部署在并行数据库的高端服务器转移至更便宜的无共享体系结构的低端服务器集群上.论文提出了集成MapReduce和数据库的高效经济SaaS架构—HyDB系统,解决海量结构化,半结构化与非结构化数据的高效查询服务,通过对数据的存储模型和查询模型进行研究,提出了完整的数据存储和查询服务方案,给出基于队列的作业调度算法,并支持针对简约数据查询的快速响应模式.最后通过可扩展实验,证明了该系统架构具有良好的加载性能、查询性能和容错能力,可以为用户提供优质的数据服务. 相似文献
10.
传统的信息集成虚拟方法通常采用Wrapper技术实现结构化异构数据的抽取。针对Wrapper与结构化异构数据源间一对一关系的非灵活性,提出了一种基于公共仓库元模型CWM(Common Warehouse Metamodel)的信息集成架构,利用CWM独立于任何具体实现的优势,在其基础上生成的Wrapper程序可以很好地适用于与之相关的所有结构化异构数据源的抽取。CWM元模型所提供的统一文档类型定义(DTD),使结构化异构数据源拥有了统一的XML表达方式,从而使抽取后的信息可以进行更有效的共享和转换。 相似文献
11.
基于GML的多源异构空间数据集成研究 总被引:5,自引:0,他引:5
深入分析了数据格式转换、直接数据访问和数据互操作3种数据集成模式,描述了一个基于GML数据互操作模式的、多源异构空间数据集成模型,并分析了模型的运行机制和关键技术.该模型通过使用相应的GML转换接口把分布式异构空间数据源转化为统一的GML格式文档,通过集成引擎和相应的集成规则对异构空间数据进行有效的集成,实现数据共享的目的. 相似文献
12.
13.
14.
15.
16.
解决企业数据源异构需要一种公共的数据源模型给用户提供统一的用户视图,XML以其所具有的自描述性、灵活性、强大的数据交换能力等优势克服了其他数据模式的缺点。结合当前数据集成方面的技术,提出了一种基于Ⅺ∥几虚拟数据库的异构数据源集成模型,该模型很好地解决了异构数据源集成方面存在的一系列问题,并从数据模型和数据交换上阐述了该模型的可行性。剖析了该模型中的模式集成、异构数据集成视图、全局查询等。介绍了该模型在中国石油、QHSE信息系统中的成功应用。 相似文献
17.
18.
分析了基于Web服务的敏捷供应链信息系统集成框架,在此基础上讨论了基于统一数据规范实现数据交换的流程,提出了基于Web服务的数据交换平台模型。并指出了应建立敏捷供应链信息数据交换规范,以便实现数据交换平台,完成企业间的数据交换,从而方便敏捷供应链的动态集成。 相似文献
19.
分析了基于Web服务的敏捷供应链信息系统集成框架,在此基础上讨论了基于统一数据规范实现数据交换的流程,提出了基于Web服务的数据交换平台模型。并指出了应建立敏捷供应链信息数据交换规范,以便实现数据交换平台,完成企业间的数据交换,从而方便敏捷供应链的动态集成。 相似文献