职位描述
1. 负责训练平台、LLM 推理集群服务搭建及优化,提升训练效率和模型性能;
2. 设计和实现高效的分布式训练算法和策略,提升训练效率和模型性能;
3. 调研最新的分布式训练技术并应用于公司项目。
职位要求
1. 硕士学位,5年及以上经验,计算机科学、人工智能、数学或相关领域专业优先;
2. 熟悉 Golang &Python,熟悉计算机体系结构以及并行计算基本技术,有 GPU研发经验;
3. 至少拥有一方面3年以上的经验:分布式系统/API设计/大规模集群管理/System for ML
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕