首页|面向大数据场景的系统性能优化实践

面向大数据场景的系统性能优化实践

扫码查看
在现有大规模分布式环境中,大数据应用的性能与计算效率仍有较大的提升空间.然而,在大规模环境中进行性能分析与优化需要大量领域专家.针对大数据应用中的性能优化问题,提出了一个通用的低效查询语句检测与优化流程,总结了4类显著影响大数据应用性能的低效行为,并针对每一类低效行为,提出了具体的优化策略.最后,通过实验评估验证了提出的优化方案在实际大规模集群中的有效性.
System performance optimization practice for big data scenarios
In the existing large-scale distributed environments, there is still much room for improvement in the performance and computational efficiency of big data applications. However, performance analysis and optimization in large-scale environments requires a large number of human resources from domain experts. This paper proposes a general low-performance query statement detection and optimization process for performance optimization in big data applications, summarizes four types of low-performance behaviors that significantly affect the performance of big data applications, and proposes specific optimization strategies for each type of low-performance behavior. Finally, through experimental evaluation, the effectiveness of the optimization scheme in actual large-scale cluster is verified.

Hadoopbig data systemperformance optimizationtuning tool

王冀彬、杨海龙、冯凯、孙欣、张敏达、雷克伦、肖智文、张逸飞、吴佳熙

展开 >

中国移动信息技术中心,北京 100033

北京航空航天大学,北京 100191

中移信息技术有限公司,广东 深圳 518048

Hadoop 大数据系统 性能优化 调优工具

国家重点研发计划项目国家自然科学基金项目国家自然科学基金项目国家自然科学基金项目国家自然科学基金项目中央高校基本科研业务费专项

2023YFB45031006232220162072018U23B2020U22A2028YWF-23-L-1121

2024

大数据
人民邮电出版社

大数据

CSTPCD
ISSN:2096-0271
年,卷(期):2024.10(4)
  • 5