职位详情
大模型部署工程师
4万-5万
北京脑科学与类脑研究所
北京
不限
硕士
12-19
工作地址

北京市昌平区中关村生命科学园医科路9号院3号楼

职位描述
工作职责:
1. 负责主流大语言模型(如 LLaMA、Mistral系列)及多模态模型的部署与性能调优,确保其在服务器上高效运行;
2. 设计并搭建高性能推理服务系统,支持大模型在实际应用中的低延迟、高吞吐需求;
3. 负责开发自动化部署流程,简化大规模模型的上线与版本管理;
4. 监控 GPU/CPU 资源使用情况,排查性能瓶颈,并进行合理的调度与资源分配。
工作要求:
1. 计算机科学、人工智能、软件工程等相关专业硕士及以上学历,具有丰富的实战经验可酌情放宽;
2. 熟练使用 Python 进行开发,具备良好的代码规范与文档习惯;
3. 了解 Linux 环境下的系统开发与优化,熟悉分布式部署流程;
4. 熟练掌握至少一种大模型推理与部署框架,如 vLLM、Ollama、huggingface TGI 等;
5. 具备 GPU 加速技术经验(CUDA、cuDNN),熟悉混合精度计算与模型压缩方法;
6. 有大规模深度学习模型部署经验,具备优化多卡训练与推理速度的实践经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请