电信技术2019,Issue(12) :28-31.

加速AI分布式训练研究和实践

朱祥磊
电信技术2019,Issue(12) :28-31.

加速AI分布式训练研究和实践

朱祥磊1
扫码查看

作者信息

  • 1. 中国移动通信集团山东有限公司
  • 折叠

摘要

随着运营商智慧AI应用所处理的数据和深度学习模型的规模变得日益庞大,需要反复的迭代和优化过程,人工智能的分布式训练变得越来越重要.文中对分布式训练的关键要素和方法进行研究,如模型并行、数据并行(同步更新、异步更新)、通信网络设计等方面.最后对山东移动在AI架构设计和提高AI模型的分布式训练效率的实践和经验进行总结.

关键词

人工智能/分布式/训练/GPU/高速网络

引用本文复制引用

出版年

2019
电信技术
人民邮电出版社

电信技术

影响因子:0.448
ISSN:1000-1247
被引量1
参考文献量3
段落导航相关论文