计算机研究与发展2022,Vol.59Issue(3) :597-616.DOI:10.7544/issn1000-1239.20210577

近数据计算下键值存储中Compaction并行优化方法

Near-Data Processing-Based Parallel Compaction Optimization for Key-Value Stores

孙辉 娄本冬 黄建忠 赵雨虹 符松
计算机研究与发展2022,Vol.59Issue(3) :597-616.DOI:10.7544/issn1000-1239.20210577

近数据计算下键值存储中Compaction并行优化方法

Near-Data Processing-Based Parallel Compaction Optimization for Key-Value Stores

孙辉 1娄本冬 1黄建忠 2赵雨虹 3符松4
扫码查看

作者信息

  • 1. 安徽大学计算机科学与技术学院 合肥 230601
  • 2. 华中科技大学武汉光电国家研究中心 武汉 430074
  • 3. 中国科学院信息工程研究所 北京 100093
  • 4. 北德克萨斯大学计算机科学与工程系 美国德克萨斯州登顿 76203
  • 折叠

摘要

大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写,从而提升性能.然而,LSM-tree键值存储也存在一些性能问题.一方面,键值存储利用compaction操作更新数据,保持系统平衡,但造成严重的写放大问题.另一方面,以传统计算为中心的架构下,compaction操作带来大量的数据传输,影响了系统性能.以数据为中心的近数据计算模型(near-data processing,NDP)为基础,利用该模型下主机端与近数据计算使能设备端的并行资源,提出基于系统并行与流水线并行的compaction优化方法(collaborative parallel compaction optimization for LSM-tree key-value stores,CoPro).当处理 compaction 操作时,CoPro主机端与NDP设备端协同执行compaction卸载任务.此外,进一步提出基于决策组件的CoPro+,根据系统资源变化以及负载键值对中值大小的变化来动态调整并行度,使NDP架构中计算资源的使用更加高效.在搭建的硬件平台上验证了CoPro的有效性.

关键词

日志归并树/键值存储/近数据计算/任务卸载/数据-流水线并行

引用本文复制引用

基金项目

安徽高校协同创新项目(GXXT-2019-007)

计算机体系结构国家重点实验室中国科学院计算技术研究所开放课题(CARCH201915)

国家自然科学基金(62072001)

国家自然科学基金(61702004)

国家自然科学基金(61572209)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量1
参考文献量1
段落导航相关论文