摘要
网络资源的覆盖范围日益广泛,算力资源也逐渐成为能够提供泛在计算服务的基础设施.然而,在广域网络,底层网络和计算资源缺乏密切的研究或协同设计,仍然存在计算服务调度缓慢、数据分发不灵活、数据传输效率低等问题.本文提出算力感知网络(CAN)的系统架构设计,其核心贡献在于引入感知平面来收集、管理并综合计算和网络的信息.这样,感知平面、控制平面和数据平面组成一个闭环控制系统,增强了整个系统的感知能力、决策能力和数据转发功能.为了使能CAN系统,本文提出三项关键技术:算力路由、弹性广播和广域高吞吐传输.本文以人工智能(AI)模型训练、推理和离线参数传输为例,展示CAN的适用性,并指出未来的一些研究方向.
基金项目
国家自然科学基金(62032003)
Beijing Outstanding Young Engineers Innovation Studio,China(2023)()