首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
非结构化数据的ETL设计   总被引:1,自引:0,他引:1  
为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的属性提取和数据打包的方法,为非结构化数据形成元数据奠定了基础,从而实现了非结构化数据的ETL设计,设计完全满足标准的数据整合要求。  相似文献   

2.
医院数据中心涉及的系统较多,逐渐形成了经典的分层整合信息架构。文章基于医院数据中心建设需求展开,指出传统数据中心存在的缺点,建议将结构化数据和非结构化数据分别单独构建双活数据中心。通过分布式存储双活副本,结合目前成熟的服务器虚拟化技术,双活数据中心解决方案能轻松打破数据中心不同位置存储设备和服务器业务应用壁垒。  相似文献   

3.
企业非结构化数据检索研究   总被引:3,自引:0,他引:3  
随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。  相似文献   

4.
如今的数据,除了具有一定模式的规范数据外,还大量存在着非规范数据,这些数据都是非结构化的数据。另外还有一种介于结构化数据和非结构化数据之间的,即半结构化数据。那么,这些不同结构的数据如何高效存储、友好查询,满足用户的多方面需求呢?  相似文献   

5.
王传东  赵宇  孙潇静 《通讯世界》2016,(14):266-266
企业在经营管理的过程中会出现大量的非结构化数据,如果忽视对其进行数据价值挖掘,企业对市场的适应能力将被严重的削弱,所以企业级非结构化数据管理平台的构建越来越受到关注,本文以Linux集群为基础的Hadoop开发框架管理平台为对象,对企业非结构化数据管理平台架构、平台功能和特点展开研究,为提升企业级非结构化数据的管理水平作出努力。  相似文献   

6.
以非结构化数据高精度提取为目的,利用改进K-均值算法聚类云数据库非结构化数据,对分类后非结构化数据进行归一化预处理;通过基于自然语言语义的数据库目标检索模型,对预处理后的多种云数据库非结构化数据,按照用户需求实时提取。经测试:所提方法在不同数据集中,对多种类型的云数据库非结构化数据提取结果存在可信度,最大偏差为1个,偏差极小,在可接受范围内,可高精度提取云数据库非结构化数据。  相似文献   

7.
大数据时代的到来,不仅意味着大量的结构化数据,还有海量的非结构化数据,如视频、图像、语音等。如何帮助客户在数据中间找到关联,并挖掘出信息价值,将是企业赢得大数据时代的重要机遇。作为一家提供基于意图业务解决方案的服务商,NICE正在做这样的尝试。跨渠道的分析能力"意图"的得知并非妄加猜测,而是基于大量的数据分析。传统用户与企业的交流,如客户服务主要以语音为主,但在信息化飞速发展的当下,利用网站、短信、即时通信(IM)、社交工具等途径,正成为用户的多样化选择。而从众多不同沟通途径中分析  相似文献   

8.
为了对各种监控系统进行监测数据存储和回放,以Visual C++6.0为开发平台,建立了监控系统与PC机之间的串口通信,运用开放数据库互连技术将数据写入Access数据库.在显示终端,采用标准的SQL结构化查询语言完成数据查询,将存储的数据以动态图形的形式进行回放.引入水晶报表控件动态连接到监控系统的数据源,为所需要的数据表记录生成报表并实现了报表打印功能.  相似文献   

9.
文章针对大数据环境下的非结构化数据的特性和存储现状进行分析,运用分布式云存储理论,以及分布式技术和软硬件一体化原理,提出一个务实的高性能、可伸缩、易管理的分布式海量非结构化信息处理解决方案。  相似文献   

10.
众所周知,通信运营商之间的竞争已经进入到更深的层次,在通信服务供应商的托管网络上提供视频、移动电视及通讯等优质内容已经改变了通信行业的现状。通过使用分析软件来获得有关用户使用模式、偏好和兴趣的实时洞察,通信服务供应商能充分利用这些商机,更有效地与新供应商进行合作。中国惠普企业服务集团CTO王纪奎向记者表示:"通信服务供应商拥有大量关于用户的信息,包括用户偏好、习惯及其所有移动活动,但是他们必须能够利用这些数据来开发新产品并推动企业发展。  相似文献   

11.
为了解决信息系统开发中非结构化数据存储访问与加密的难题,将这类数据以二进制对象字段(BLOB)存储在数据库中,并以二进制数据流方式实现数据的加密、传输、存储与访问,从而达到快速安全访问此类数据的目的.本文详细介绍了基于ADO数据访问技术操作BLOB数据的原理与方法,并在此基础上给出了基于VC++.NET和ADO数据访问技术实例应用和部分程序代码.  相似文献   

12.
尝试对复杂报表进行结构化描述,利用结构化描述数据和自定义的用户对象提供的接口极大地简化了复杂报表的制作,就复杂报表的结构化描述做了详细的描述。  相似文献   

13.
林晓轩 《世界电信》2014,(1):104-106
目前工商银行集中精力把来自于各个渠道的分散数据,实行标准化、结构化的处理,同时把这些数据应用在服务、创新、风险的控制,包括提升内部各类流程的效率等.  相似文献   

14.
大数据来了!     
当业界反复讨论海量数据增长、非结构化数据挑战、大数据究竟是什么等话题时,大数据时代已经来临,越来越多的企业已开始意识到数据的价值,以及大数据所带来的创新机遇。但与此同时,大数据泡沫日益增多,话题炒作被《驾驭大数据》一书作者Bill Franks视为已达顶峰。本期《通信世界》将从实际案例出发,呈现大数据的行业应用,并选取电子商务、金融保险两个国内大数据应用走在前列的行业,作为代表予以参考。同样,在电信行业中,大数据的价值也正在被运营商所看重,在后续报道中,《通信世界》将会呈现大数据在电信行业的应用。)  相似文献   

15.
陈军 《中国信息界》2005,(19):42-42
从目前国内电子政务普遍应用需求来看,大多需要将原本分散于各环节、不同职能部门间异构的文档信息和内容进行有效集成。这就要求应用软件系统处理各种信息时,必须面对大量的结构化和非结构化数据混杂的局面。目前,人们日常生活中所面对的更多的是非结构化数据,这些非结构化数据大多仍然以纸质文档或者办公软件(如Word、PDF、WPS等)制作的文档形式存在。  相似文献   

16.
, 《电信技术》2012,(11):77-77
Teradata近日,推出了新的分析架构服务,以加速Teradata统一数据架构的部署。Teradata统一数据架构可获取和分析结构化及多结构化数据。  相似文献   

17.
为提升非结构化数据处理过程中数据库主机的存储能力,设计了面向数据库查询制度的非结构化数据融合存储系统。根据非结构化存储框架连接形式,确定融合控制电路对于数据存储载体的约束作用能力,完成数据融合存储系统的关联硬件执行环境搭建。定义查询指令所属类型,通过优化非结构化数据目标的方式,得到最终的数据融合代价估算结果,完善面向数据库查询的信息参量存储策略。联合相关硬件执行设备,实现非结构化数据融合存储系统设计。实验结果表明,与传统I/O模拟器存储网络相比,在处理非结构化数据时,融合存储系统的数据库主机明显具备更强的信息存储能力,与之相关的数据信息连接并发个数值也相对更大。  相似文献   

18.
文章提出了一种将非结构化数据集中存储,同时支持事务的存储方案,并依据此方案实现了一个高效、易用的数据存储系统GSL。GSL的数据存储接口与文件系统的接口风格一致,同时支持事务处理。文章将GSL与文件系统和Oracle数据库的BLOB存储效率进行了测试和比较,结果表明GSL的存储效率与文件系统相当,并优于BLOB。  相似文献   

19.
云计算下非结构化大数据存储系统设计   总被引:1,自引:0,他引:1  
《现代电子技术》2018,(1):173-177
当前云计算下非结构化大数据存储系统设计方法是通过使用分布式数据库存储跨区域的云计算数据和全局数据存储管理目录实现的,运行系统复杂,成本高昂。为此,提出基于HBase的云计算下非结构化大数据存储系统设计方法,首先对云计算下非结构化大数据进行分析,完成云计算下非结构化大数据提取,为云计算下非结构化大数据存储系统框架设计创造条件,并介绍HBase的特点,得到基于HBase非结构化大数据存储系统架构及运行流程,然后进行云计算下非结构化大数据存储结构模型总体设计及非结构化大数据分布式结构分析,采用负载均衡控制方法进行云计算下非结构化大数据存储系统冗余数据特征压缩及信息存储优化算法设计,完成云计算下非结构化大数据存储系统设计。通过仿真实验证明,所提方法能够有效降低云计算下非结构化大数据存储花费的时间,保证存储的数据可用、不丢失,方便云计算下非结构化大数据的使用,具有较强的使用价值。  相似文献   

20.
文章通过研究和分析了典型的NoSQL数据库技术,基于该平台和Hadoop云架构,完成了非结构化的数据云存储架构的设计,可以很好的解决传统的关系型数据库在应对非结构化数据存储过程中的效率低下等问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号