职位描述:
1.从事AI算法模型在不同平台上的工程化设计、实现与加速、系统集成与工程化落地;
2.公司AI服务器软硬件平台的规划、定义和技术架构设计;
3.根据公司AI专案应用情景,规划与设计视觉算法工程化、机器学习平台,开发和日常运营。
职位要求:
1.博士学位,大学计算机相关专业,必须具备扎实的技术背景
2.三年以上年软件开发经验,熟悉多种编程语言和开发框架,如Java、Python、C++等;
3.熟悉tensorflow/pytorch、ray等分布式训练框架,有ARM、X86算法部署或熟悉CUDA开发者优先; 熟悉多GPU分布式并行计算、熟悉NCCL通信机制,熟悉分布式机器学习,熟悉热门框架者优先,包括但不限于:Megatron、DeepSpeed、Pytorch、等;
4.了解机器学习的基本方法,熟悉算法研发和迭代的流程;
5.有GPU资源管控或作业调度工作经验者优先;
6.有良好中英文口语表达能力和优秀的书面文案写作能力,具备优秀的向跨领域的听众表达复杂概念的能力。