首页 | 本学科首页   官方微博 | 高级检索  
     

基于在网计算加速的拜占庭容错算法
引用本文:杨帆,张鹏,王展,元国军,安学军.基于在网计算加速的拜占庭容错算法[J].计算机研究与发展,2021,58(1):164-177.
作者姓名:杨帆  张鹏  王展  元国军  安学军
作者单位:中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049 ;中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049 ;中国科学院计算技术研究所 北京100190;中国科学院计算技术研究所 北京100190;中国科学院计算技术研究所 北京100190
基金项目:国家自然科学基金青年基金项目;中国科学院战略性先导科技专项(B类)项目;国家重点研发计划项目
摘    要:拜占庭容错算法是一类能够容忍各种形式的软件错误和安全漏洞的容错算法,对云计算的可靠性保障有着重要意义.与其他容错算法相比,拜占庭容错算法稳定性更高,但是其性能表现低下,不能满足当前系统对高吞吐、低延时的需求.在网计算是一种以数据为中心的体系结构,它用网络承担部分计算功能,使数据在流动过程中获得处理,从而提高系统性能.为解决拜占庭容错系统的问题,提出了一种基于在网计算的拜占庭容忍共识算法优化方案,将算法的一部分处理任务卸载到网卡上执行,利用网卡和处理器形成的多级流水线提升系统吞吐量.由于仅使用在网计算的方案在特定场景下效果不佳,因此,使用多线程方法来提升优化方案的可扩展性.同时,对算法进行了详细的系统评测,实验结果表明:相对于普通的拜占庭容错系统,使用在网计算与多线程结合的优化方案能够获得46%的吞吐率提升以及65%的延迟下降,证明了基于在网计算的拜占庭容忍共识算法优化方案的可行性与有效性.

关 键 词:分布式系统  拜占庭容错算法  在网计算  加速器  高性能计算

Accelerating Byzantine Fault Tolerance with In-Network Computing
Yang Fan,Zhang Peng,Wang Zhan,Yuan Guojun,An Xuejun.Accelerating Byzantine Fault Tolerance with In-Network Computing[J].Journal of Computer Research and Development,2021,58(1):164-177.
Authors:Yang Fan  Zhang Peng  Wang Zhan  Yuan Guojun  An Xuejun
Affiliation:(Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190;University of Chinese Academy of Sciences,Beijing 100049)
Abstract:Byzantine fault tolerance algorithm is one kind of fault-tolerant algorithms which can tolerate various software errors and system vulnerabilities.It is of vital importance to the reliability of cloud computing.Compared with other fault-tolerant algorithms,such as proof-of-work(PoW),Byzantine fault tolerance algorithm is much more stable,however,its poor performance cannot meet the demand of cloud computing which requires high throughput and low latency.In-network computing is a data-centric architecture that uses the network to perform some calculations.Using in-network computing,data can be processed as it moves,thereby improving system performance.To solve the performance problem of Byzantine fault tolerant system,in this paper,we propose a Byzantine fault tolerance algorithm optimization strategy with in-network computing,which offloads some of the computational tasks to the network interface card(NIC).The processor and NIC form a multi-stage pipeline which helps us improve the system throughput.Simply using in-network computing can not meet the performance goals in all scenarios,hence we utilize multi-threading technology to scale the system.We evaluate our method on real testbed,and the experimental results show that,compared with the default Byzantine fault tolerant system,we can obtain 46%improvement in overall throughput and 65%decrease in latency.The results have proved our solution to be available and effective.
Keywords:distributed system  Byzantine fault tolerant algorithms  in-network computing  accelerator  high performance computing
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号