岗位职责:
1、负责AI平台服务端应用开发
2、制定开发计划,按照需求功能点进行开发,并完成自测试 ;
3、根据测试反馈Bug进行修复;
4、参与项目相关开发文档编写;
5、完成项目经理/技术经理安排的相关任务。
任职要求:
本科以上学历,硕士以上学历优先,具有良好的大模型研发与落地相关技术能力,
包括:
1)精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架;
2)熟悉NLP、AIGC、多模态、CV和语音等AI算法,对开源大模型项目(如BERT、GPT、T5、GLM、LLaMA等)有深入研究和实践经验;
3) 熟悉大模型技术以及训练、微调技术,如LoRA、p-tuning、SFT、RLHF等; 4)熟悉大模型的分布式系统和多GPU优化,具有跟踪和探索分布式优化新技术的能力,熟悉包括Kubeflow在内的AI平台;
5)熟悉大模型分布式训练技术和框架库,如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码