10-25 14:19
工作职责:
-负责百度AI计算集群网络性能相关的诊断与优化
-负责百度AI计算集群通信库研发与运维部署
-负责百度AI计算中训练、推理依赖的通信加速
-负责百度AI计算集群与通信关联的其他软件研发工作
职位要求:
-熟悉AI计算基本模式与集群设计构建
-了解流行的AI训推框架(如Megatron、vLLM等)
-熟悉RDMA等高性能网络技术和NCCL等集合通信库
-有集群管理、运维等相关的研发经验
工作地点:北京
简历发送至:chenshanqing@baidu.com
-负责百度AI计算集群网络性能相关的诊断与优化
-负责百度AI计算集群通信库研发与运维部署
-负责百度AI计算中训练、推理依赖的通信加速
-负责百度AI计算集群与通信关联的其他软件研发工作
职位要求:
-熟悉AI计算基本模式与集群设计构建
-了解流行的AI训推框架(如Megatron、vLLM等)
-熟悉RDMA等高性能网络技术和NCCL等集合通信库
-有集群管理、运维等相关的研发经验
工作地点:北京
简历发送至:chenshanqing@baidu.com
说两句