期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

海量存储系统中高可扩展性元数据服务器集群设计 总被引：1，自引：0，他引：1

吴伟谢长生韩德志黄建忠《计算机科学》2007,34(7):106-109

海量存储系统都采用元数据服务器机群的方式来处理文件系统的元数据信息。很多存储系统采用Hash算法来实现文件元数据在元数据机群内的分布，但是这些算法都是针对文件进行Hash。本文提出了一种目录哈希的新算法，针对目录进行Hash，并把一个目录内的元数据集中存储。本算法克服了文件Hash的不足，改善了存储系统的性能，并极大地提高了存储系统的可扩展性。相似文献

2.

OCFS：一种基于对象存储结构的可伸缩高性能集群文件系统

刘仲王涌章文嵩邓鹍王昭福《通讯和计算机》2007,4(6):1-13

提出了一种基于确定性随机分布算法分布元数据和数据对象的可伸缩集群文件系统结构。其中目录路径属性与目录对象分离的元数据管理方法，在提高系统性能、均衡元数据分布和减少元数据迁移等方面具有明显优势。提出的基于动态区间映射的数据对象布局算法，支持权重分布和副本，在均衡数据分布和最少迁移数据方面都具有统计意义上的最优性，有效解决了动态存储系统的数据均衡分布与可伸缩性问题。相似文献

3.

基于数据挖掘的文件元数据预取探究

唐燕群《信息安全与技术》2014,(3):19-20,34

在文件存储系统中,文件系统整体性能的提升对于保证文件的安全性和可靠性具有重要意义,而在此过程中,元数据访问性能与文件系统性能有密切关系,要想进一步满足大规模文件存储系统需要,就必须建立相应的文件元数据预取模型。本文通过对基于数据挖掘的文件元数据预取进行分析,以期满足文件数据的大量存取访问需求。相似文献

4.

MDDS:一种面向高性能计算的并行文件系统元数据性能提升方法

陈起陈左宁蒋金虎《计算机研究与发展》2014,51(8)

随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统性能要求越来越高.在海量小文件和大规模并发I/O操作的应用场景中,文件系统元数据的吞吐率成为限制其性能的关键因素.设计并实现了元数据代理(meta data delegation service,MDDS),通过降低元数据服务间的耦合度,保证元数据集群的高可用性;使用目录子树方式管理元数据代理空间,避免跨节点目录引入的分布式原子操作的复杂性和低效性.并针对高性能计算中I/O转发架构,提出基于元数据代理的两种作业调度策略——单作业独占单元数据代理调度和多作业共享多元数据代理调度——实现作业间和作业内的负载均衡.在116台存储服务器上对MDDS进行评估,实验结果表明,元数据代理提供了拟线性的元数据性能,在大规模的环境中较Lustre CMD方案有较好的扩展性;两种调度方式有效分散了作业元数据的负载,改善了高性能计算中的元数据瓶颈问题. 相似文献

5.

基于对象存储系统的HIFS目录管理的设计研究

刘华锋《软件导刊》2010,(1)

目录管理用于在操作系统下以文件视图的方式提供整个存储系统的文件和目录。目录管理是操作系统里最频繁的操作。文件系统的用户如果想要知道某一目录下面的文件内容,或者想要得到某一目录下面的所有文件和目录的元数据信息,文件系统调用目录管理模块。结合Windows下的对象存储系统客户端文件系统HIFS(Hust Installable File System),进行HIFS系统的目录管理设计。相似文献

6.

LCFS中元数据服务器的可靠性分析模型 总被引：3，自引：0，他引：3

下载免费PDF全文

王召福章文嵩刘仲《计算机工程与科学》2005,27(5):54-55

可靠性问题是研究大规模集群存储系统的一个重要方面，元数据服务器是大规模集群存储的中心。本文针对基于镜像复制和共享存储的服务器实现方案，采用马尔可夫补偿模型研究元数据服务器的状态迁移概率，分析了元数据服务器集群的可靠性以及数据一致性对可靠性的影响，对实现大规模集群文件系统中的元数据服务器有重要的指导意义。相似文献

7.

基于层次结构的元数据动态管理方法的研究

刘群冯丹《计算机研究与发展》2009,46(Z2)

在大规模分布式存储系统中,元数据高性能服务和扩展性已成为一个重要的研究热点.在元数据服务器(metadata server,MDS)中,将元数据分解为目录对象和文件对象.目录对象为定位性元数据,提供文件所在位置和访问控制;文件对象为描述性元数据,描述文件的数据特性.每个MDS负责所有目录对象和自身的文件对象,同时,以目录对象ID和文件名为关键字的Hash值作为局部元数据查找表的索引,通过Bloom Filter算法将每个MDS的局部元数据查找表压缩成一个摘要,这样既可利用MDS中Cache,提高Cache的命中率,减少磁盘I/O次数,动态扩展MDS,又能够实现快速的元数据查找. 相似文献

8.

大规模集群文件系统LCFS的元数据管理与访问机制 总被引：2，自引：0，他引：2

王召福章文嵩刘仲《计算机工程与科学》2005,27(8):103-105

文件系统的元数据包括文件基本属性信息和目录结构信息。在基于集群技术的大规模文件系统中,有效的元数据管理是系统实现的核心。本文在设计了与元数据管理相关的三类协议的基础上,提出了集群化的元数据服务器实现模型,并分析和比较了各种实现方式的优缺点。相似文献

9.

基于对象存储的集群存储系统设计 总被引：3，自引：0，他引：3

下载免费PDF全文

刘仲章文嵩王召福周兴铭《计算机工程与科学》2005,27(2):78-81

集群存储是解决大规模数据存储的重要方法。本文提出一种基于对象存储的集群存储系统结构,将文件分为目录路径元数据、文件元数据与数据对象三部分并独立管理。性能比较与分析表明,该方法能够支持超大规模的文件及超大容量的目录,明显地减少网络访问消息数量,提高访问性能,并且解决了因为修改目录而导致的大量元数捂迁移问题。相似文献

10.

一种元数据服务器集群的负载均衡算法

王娟冯丹王芳廖振松《小型微型计算机系统》2009,30(4)

在基于对象的存储系统中,元数据访问非常频繁,大规模存储系统中元数据的访问是潜在的系统性能瓶颈.元数据服务器集群中必须负载均衡,以防某个元数据服务器成为存储系统访问的瓶颈.现有文章中很少有研究元数据服务器集群的负载均衡的文章.本文中采用元数据请求的响应时间来衡量一个元数据服务器的负载情况,首先从映射算法上实现静态负载均衡,并针对元数据热度差别大而引起的负载不均衡引入动态负载均衡,通过仿真结果显示其有效性. 相似文献

11.

新型虚拟文件存储系统的设计

任勇朱立谷张雷彭建峰《计算机研究与发展》2009,46(Z2)

随着用户存储和使用的文件数量和种类的急剧增长,现存的文件存储系统渐渐不能满足有效管理这些信息的需求.传统文件系统遵守严格的层次结构;以树状结构来组织文件;用户只能以单一化的存储路径来访问文件.为了解决这些不足,设计和开发了VFSS,它充分利用被存储文件的元数据信息,将文件存储系统和数据库技术相结合,以网状方式组织文件.VFSS提供丰富的用户接口,同时支持传统文件系统操作. 相似文献

12.

基于Ceph存储系统的小文件存储优化方案

陈法河柴小丽《计算机系统应用》2022,31(2):108-113

针对Ceph存储系统面对小文件存储时存在元数据服务器性能瓶颈、文件读取效率低等问题.本文从小文件之间固有的数据关联性出发,通过轻量级模式匹配算法,提取出关联特征并以此为依据对小文件进行合并,提高了合并文件之间的合理性,并在文件读取时将同一合并文件内的小文件存入客户端缓存来提高缓存读取命中率,经过实验验证本文的方案有效的提高了小文件的访问效率. 相似文献

13.

基于Hadoop的气象信息数据仓库建立与测试

薛胜军刘寅《计算机测量与控制》2012,20(4):926-928,932

气象相关的数据随着气象事业现代化水平的不断提高而与日俱增,使得气象部门对于气象数据存储、管理和读取的要求越来越高;通过分析开源云平台Hadoop的分布式文件系统HDFS、数据仓库工具Hive等架构,研究了Hadoop气象云平台的构建过程,最终实现了气象信息数据仓库的建立与测试;该气象信息数据仓库实现了海量气象数据文件的分布式存储、元数据管理以及气象数据的查询;应用表明,使用气象数据仓库进行大型气象数据文件存储和操作时,可以大大提升数据吞吐率和数据读写操作效率。相似文献

14.

一种性能优化的小文件存储访问策略的研究 总被引：1，自引：0，他引：1

赵跃龙谢晓玲蔡咏才王国华刘霖《计算机研究与发展》2012,49(7):1579-1586

在分布式文件系统中,小文件的管理一般存在访问性能较差和存储空间浪费较大等缺点.为了解决这些问题,提出了一种性能优化的小文件存储访问(SFSA)策略.SFSA将逻辑上连续的数据尽可能存储在物理磁盘的连续空间,使用Cache充当元数据服务器的角色并通过简化的文件信息节点提高Cache利用率,提高了小文件访问性能;写数据时聚合更新数据及其文件夹域中的相关数据为一次I/O请求写入,减少了文件碎片数量,提高了存储空间利用率;文件传输时利用局部性原理,提前发送批量的高访问率的小文件,降低了建立网络连接开销,提升了文件传输性能.理论分析和实验证明,SFSA的设计思想和方法能有效地优化小文件的存储访问性能. 相似文献

15.

An SSD-based accelerator for directory parsing in storage systems containing massive files

Zhiguang Chen Nong Xiao Fang Liu 《Peer-to-Peer Networking and Applications》2013,6(4):397-408

Data explosion introduces new challenges to storage systems. In a file system for big data, a large number of directories and files exist, which are usually organized in a large tree. Parsing directories in a large tree is difficult. In this paper, we propose an accelerator, which helps file systems to fetch the metadata of files rapidly. Contributions of this work include two aspects. First, we propose an accelerator for directory parsing. The accelerator is actually an SSD-based (Solid State Drive-based) cache, which keeps the metadata of frequently or recently accessed files and directories. When a file is demanded, the accelerator attempts to obtain its metadata directly from SSD. If the metadata is kept in SSD, the file system can rapidly obtain the metadata. However, if the metadata is not in SSD, the accelerator consumes a long time to access SSD, but to no avail. In order to avoid non-beneficial SSD accesses, the accelerator predicts whether the metadata is kept by SSD before issuing a read request. Only if the metadata has a high probability of being kept in SSD, the accelerator issues a request to the SSD. The second contribution of this paper is a new bloom filter used to predict whether a piece of data is kept in SSD. Bloom filter is a space-efficient data structure supporting membership query. But, the standard bloom filter cannot support element deletion. Whereas, our accelerator is a cache, which evicts items periodically. The standard bloom filter is not suitable for our accelerator. In this work, we designed a new bloom filter with low overhead, which supports element deletion. The new bloom filter perfectly suits the proposed accelerator. With the prediction of our bloom filter, the accelerator can accelerate the process of directory parsing with nearly no negative impact. We evaluated the accelerator by using a prototype. Experimental results demonstrate that, the accelerator can speed up the directory parsing process by nearly four times compared with a file system without an accelerator. 相似文献

16.

一种基于对象存储的文件系统的设计 总被引：1，自引：0，他引：1

卢萍陈进才《计算机科学》2008,35(10):131-133

随着存储技术的飞速发展,对象存储设备面临如何高效存储并管理TB级容量数据的问题.针对Linux通用文件系统Ext2在处理大文件和巨型目录结构时存在的局限性,采用B 树结构设计并实现了一种基于连续块的对象文件系统.对该文件系统进行的测试结果表明,该文件系统的读写效率较高,而且随着文件的增大,性能保持稳定. 相似文献

17.

BWMMS元数据分布信息缓存管理

杨德志许鲁张建刚《计算机科学》2007,34(10):143-145

BWMMS是BWFS的分布式文件系统元数据服务子系统。它充分利用系统访问负载的动态性和局部性特征，通过简单的集中决策机制管理元数据请求负载在多个元数据服务器的分布。为降低集中决策点可能的瓶颈限制，集中决策点位于元数据请求处理路径的末端。本文介绍各个元数据服务器上用来降低对后端集中决策点的压力，提高元数据访问效率的元数据分布信息缓存，并通过测试数据评估缓存命中率对后端集中决策点和元数据访问效率的影响。相似文献

18.

海量小文件系统的可移植操作系统接口兼容技术

陈博何连跃严巍巍徐照淼徐俊《计算机应用》2018,38(5):1389-1392

基于Hadoop分布式文件系统（HDFS）研发的海量小文件系统（SMDFS）遗留了HDFS不兼容可移植操作系统接口（POSIX）约束的问题,为解决SMDFS的这一问题,提出基于本地缓存的POSIX兼容技术和基于数据暂存区的元数据高效管理技术。首先,通过设置数据暂存区来实现读写模式文件流的重定向,然后建立异步线程池模型,实现数据暂存区镜像文件的同步,从而完成用户层到存储层的所有POSIX相关的文件操作。此外,借助跳表结构的元数据缓存实现List目录等元数据操作效率优化。测试表明,相较于HDFS的Linux客户端,基于技术成果实现的SMDFS3.0的随机读性能有10倍以上的性能提升,顺序读和顺序写性能有约3~4倍的提升,随机写性能可以达到本地文件系统的20%,基于目录的元数据缓存的设计使目录的List操作效率提升近10倍。但是,由于用户空间文件系统（FUSE）挂载的客户端会引入额外的内核态和用户态切换等带来的开销,因此SMDFS3.0的Linux客户端相对于系统的Java接口会有大约50%的性能损耗。相似文献

19.

面向高效文件访问的目录结构优化研究

吴阳冯径《软件工程师》2014,(11):5-7

针对气象水文应用中,大量常规观探测报文批量访问出现的低效问题,研究文件存储特性,定量分析了目录级数和文件数量对访问性能的影响,发现文件数相对于文件大小,对于系统的访问效率影响更大,当单个目录下文件数目过大时,文件存取延时较大,严重影响用户体验与服务性能。根据NTFS下的实验数据,设计了一种高效的目录组织方法,优化用户态文件存储管理算法。实验表明,优化后的文件目录结构和组织形式,能极大地提高批量文件的读取效率,降低20%—73%的访问延时,改善网络环境下的大规模文件接收处理效率。相似文献