共查询到20条相似文献,搜索用时 15 毫秒
1.
戴子良 《Windows IT Pro Magazine》2007,(1):77-79
本文以海量数据为背景。研究了在海量数据情况下处理和优化海量数据的方法。结合笔者自身实际工作经验。提出了比较实用和可行的海量数据处理方法及解决方案。[编者按] 相似文献
2.
3.
《每周电脑报》2002,(40)
数字图书馆建设过程中的一个突出难题。就是对图书,文献等海量信息资料的数字化。国家知识产权出版社在信息资料数字化过程中,通过运用“汉王 OCR 录入工厂软件系统”解决了大量专利文献的录入。国家知识产权出版社每年要出版百余种知识产权、社会科学、自然科学方面的图书、电子出版物和提供专利文献的网上查询与检索。由于专利文献不同干一般的普通文献,它涉及各个学科(如:化学\生物\物理等)的专利申请文件,其中包括化学式,分子式等专业符号和图表。而且,它还要求在版面还原时对版面信息做出标识,以支持 XML 格式的还原输出。国家知识产权出版社选用了汉王科技公司开发的“汉王 OCR 录入工厂软件系统”,它是一个包括外围管理功能在内的一整套海量文字录入解决方案(其网络结构如图1所示)。 相似文献
4.
针对海量数据查询效率低的问题,在比较和分析了多种海量数据查询优化解决方案的优缺点后,提出了一种基于数据划分的海量数据查询性能优化方法.该方法利用多数据库处理、表分区、分表技术将数据在三个维度上将数据划分存储,减少了海量数据的查询规模.经过实验该方法提高了大规模海量数据的查询效率. 相似文献
5.
6.
符丁 《电脑与微电子技术》2012,(11):29-32,40
针对隐藏于组织业务海量数据中的隐性软件需求获取提出一种方法。该方法的基本思想是:组织业务海量数据中隐含软件需求,它是以隐性知识形式存在于海量数据中的,隐性知识利用的解决方案就是组织及利益相关者对待开发软件系统的要求(软件需求)。首先,构建一个完整的、无冲突的、正确的待开发软件系统目标及其关系模型,并在待开发系统目标指导下,利用数据挖掘技术对数据进行挖掘,从中发现隐性知识;然后,识别知识的有用性和可用性;最后为可用性知识的利用提供解决方案。进而获取隐藏于大量数据中的隐性软件需求. 相似文献
7.
EMC公司Legato软件部 《信息网络》2004,(1):43-44
RepliStor是EMC公司LEGATO软件部的跨广域网、局域网的海量数据迁移解决方案,它采用获得美国专利保护的实时、异步、多点数据复制技术。该专利技术实现将客户的关键业务数据如数据库文件、文档系统、计费系统数据通过局域网或广域网迁移到另外一处或多处数据中心,从而实现数据级别高可 相似文献
8.
伴随着高速网络传输技术的发展,存储区域网络逐渐兴起并得到广泛应用。存储区域网络具有专用的存储设备、连接方式和网络协议,为海量数据安全存储提供了解决方案。本文介绍了基于存储区域网络的海量数据容灾和备份系统的设计与实现方法,探讨了如何利用存储区域网络为企业关键业务提供海量数据信息管理服务。 相似文献
9.
10.
信息技术飞速发展,作为国家战略型新兴产业的云计算、物联网、三网融合等新一代信息技术已得到广泛应用,海量信息和用户出现爆炸式增长。信息量和用户量的剧增导致信息存储技术面临多种难题,如性能低、扩展性差、可靠性不高、数据可用性差、功耗巨大、兼容性差、海量信息管理困难、产品和系统评估困难等。为此,在国家863计划重大专项课题的支持下,建立了海量信息存储测评公共服务平台,制定了全面的测评指标体系和测评方案,满足从多个维度对海量信息存储系统进行综合测评,为用户解决海量信息存储问题提供了解决方案。 相似文献
11.
本文主要是针对关系型数据库的信息管理系统在处理海量数据的存储与检索方面的一些可选方案进行探讨与分析,并结合实际应用,分别从分布式数据存储、动态表、索引、查询语句优化等4个方面对海量数据的存储与检索给出可行的优化配置解决方案。 相似文献
12.
分析了异构专利数据源集成中存在的困难,针对不同专利数据源间存在的分布性、自治性、异构性等问题,提出了一个基于混合本体的专利数据源集成解决方案.该方案采用局部本体描述单个专利数据源中的语义,通过本体合并构建全局本体实现多个专利数据源问的语义集成,定义全局本体与局部本体之间的映射关系解决多个异构数据源集成中存在的语义异构问题.使用该方案,用户可从集成的专利数据源中获取正确的查询结果,有效地解决了"信息孤岛"问题. 相似文献
13.
不断增长的处理海量信息的需求对传统存储系统提出了挑战,尤其是在该文着重讨论的海量存储系统的可扩展性方面。该文从三个层次来考察存储系统,分析了传统存储系统在可扩展性上存在的缺陷,并给出了解决方案。此方案的关键在于使用了虚拟存储的概念和利用虚拟存储的可组合性来实现系统的扩展。 相似文献
14.
随着互联网应用日益深入,信息流的迅速膨胀成为电信、金融、税务、政府、军队等高密度Web服务器环境和网络应用服务环境的焦点问题。于是,各种海量计算、海量处理、海量存储、海最通道的服务器产品相继出台,为海量数据的处理带来了各式各样的解决方案。 但海量处理服务器并不仅仅表现在存储能力的 相似文献
15.
16.
在传统的地图可视化中,面对海量地图标记物展示会采用点聚合的方式,但是各类点聚合算法都是运行时计算,没有分层机制,在海量点的散开展示时,对于地图标记物堆叠没有过滤机制。针对这一问题,提出了分层的网格划分实现海量地图标记物聚散一体化解决方案。该方法对分层网格中心点构建K-D树索引,对海量点构建四叉树索引,通过索引和存储技术,实现了聚合的高效查询。对海量点散开时增加网格过滤,消除堆叠问题。在实验案例数据集上进行对比,结果表明,与传统的点聚合方案相比,在数据量大的情况下,计算性能显著提高,对海量标记物散开展示增加过滤算法,有效提升了用户体验。 相似文献
17.
海量数据相似性连接作为海量数据处理的基本操作,在文本聚类、剽窃检测、实体解析等研究领域具有重要作用.另一方面,MapReduce编程模型因为具有良好的可扩放性、容错性和易用性,被广泛地应用于海量数据处理.因此,基于MapReduce框架的海量数据相似性连接查询技术成为海量数据处理领域的热点问题之一.首先,概括了海量数据固有特点和MapReduce编程框架的缺陷给现有相似性连接查询技术带来的巨大挑战;其次,提出了海量数据相似性连接的定义,按3种不同的分类标准对其进行了分类;接着,重点分析了集合、字符串和向量数据类型的海量相似性连接查询最新技术,并从效率和适用范围等方面分别对这些技术进行了比较;最后,讨论了海量数据相似性连接查询技术亟待解决的关键问题,并提出了一些有前景的解决方案. 相似文献
18.
基于Hadoop的海量数据存储平台设计与开发 总被引:1,自引:0,他引:1
随着北部湾海洋生态资源的开发和利用,海量海洋科学数据飞速涌现出来,利用海量数据存储平台合理管理和存储这些科学数据显得极为重要.这里提出了一种基于分布式计算技术进行管理和存储海量海洋科学数据方法,构建了海量海洋科学数据存储平台解决方案,采用Linux集群技术,设计开发一个基于Hadoop的海量数据存储平台.系统由五大模块组成,有系统管理模块、并行加载存储模块、并行查询模块、数据字典模块、备份恢复模块,能够实现存储海量海洋科学数据.系统模块实现结果表明,该系统安全可靠、易维护、具有良好的可扩展性. 相似文献
19.
20.
Oracle 10g数据库海量数据分页查询优化 总被引:1,自引:0,他引:1
Oracle数据库中海量数据分页查询效率直接关系到应用系统的执行效率。介绍Oracle 10g数据库中一种优化的海量数据分页查询解决方案,分析了传统分页查询技术的不足,将数据库优化策略、SQL语句优化、游标变量、批绑定、动态SQL等多种技术融为一体,并提供一个可以共享的、优化的存储过程,提高了海量数据的分页查询效率。 相似文献