计算机研究与发展2022,Vol.59Issue(11) :2451-2466.DOI:10.7544/issn1000-1239.20210211

一种适用于分布式存储集群的纠删码数据更新方法

An Erasure-Coded Data Update Method for Distributed Storage Clusters

章紫琳 刘铎 谭玉娟 吴宇 罗龙攀 王纬略 乔磊
计算机研究与发展2022,Vol.59Issue(11) :2451-2466.DOI:10.7544/issn1000-1239.20210211

一种适用于分布式存储集群的纠删码数据更新方法

An Erasure-Coded Data Update Method for Distributed Storage Clusters

章紫琳 1刘铎 1谭玉娟 1吴宇 1罗龙攀 1王纬略 1乔磊2
扫码查看

作者信息

  • 1. 重庆大学计算机学院 重庆 400044
  • 2. 北京控制工程研究所 北京 100080
  • 折叠

摘要

目前分布式存储集群广泛采用纠删码来保证数据可靠性,但是数据更新密集时存储集群的磁盘I/O开销会成为性能瓶颈.在常用的纠删码数据更新方法中,磁盘I/O开销主要包括:1)更新数据块时对数据节点的读后写操作;2)更新校验块时读写 日志的磁盘寻道开销.针对这些问题,提出PARD(parity logging with reserved space and data delta)数据更新方法,其主要思想是首先利用纠删码线性运算的特性来减少读后写操作;然后根据磁盘特性来降低磁盘寻道开销.PARD包含3个设计要点:1)采用即时的数据块更新和基于日志的校验块更新;2)利用纠删码线性运算的特性,构建基于数据增量的日志,极大限度地消除对数据节点的读后写操作;3)根据磁盘特性,在数据文件末尾为日志预留空间,减少读写日志的磁盘寻道开销.实验结果表明,当块大小为4 MB时,PARD的更新吞吐率相较于PLR(parity logging with reserved space),PARIX(speculative partial write),FO(full overwrite),分别 至少提升了30.4%,47.0%,82.0%.

关键词

纠删码/存储集群/数据更新/增量/预留空间

引用本文复制引用

基金项目

国家自然科学基金(62072059)

重庆市杰出青年科学基金(cstc2020jcyjjqX0012)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量1
段落导航相关论文