计算机研究与发展2021,Vol.58Issue(2) :384-396.DOI:10.7544/issn1000-1239.2021.20200369

一种基于RDMA多播机制的分布式持久性内存文件系统

A Distributed Persistent Memory File System Based on RDMA Multicast

陈茂棠 郑圣安 游理通 王晶钰 闫田 屠要峰 韩银俊 黄林鹏
计算机研究与发展2021,Vol.58Issue(2) :384-396.DOI:10.7544/issn1000-1239.2021.20200369

一种基于RDMA多播机制的分布式持久性内存文件系统

A Distributed Persistent Memory File System Based on RDMA Multicast

陈茂棠 1郑圣安 2游理通 1王晶钰 1闫田 1屠要峰 3韩银俊 3黄林鹏1
扫码查看

作者信息

  • 1. 上海交通大学计算机科学与工程系 上海200240
  • 2. 清华大学计算机科学与技术系 北京100084
  • 3. 中兴通讯股份有限公司 南京210012
  • 折叠

摘要

持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDM A多播机制的分布式持久性内存文件系统(RDM A multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10 2~219倍在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性.

关键词

持久性内存/远程直接内存访问/多播/分布式文件系统/远程过程调用

引用本文复制引用

基金项目

国家重点研发计划项目(2018YFB1003302)

上海交通大学-华为联合实验室项目(FA2018091021-202004)

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量2
段落导航相关论文