职位描述
岗位职责:
1、负责大模型算法的研发工作,包括但不限于模型设计、prompt优化、预训练、模型加速、数据集能力建设等;
2、负责大型语言模型在垂直领域数据上的微调、偏好对齐、知识增强等技术探索,结合工业界实际场景进行大模型的效果提升;
3、建立完善的大模型评估体系,提供标准化的模型评估能力,建立完善测评数据集,通过模型测评反向驱动和完善在大语言模型在实际业务场景中和技术迭代优化过程中存在的问题。
岗位要求:
1、硕士及以上学历,计算机科学、人工智能、自然语言处理或相关专业;
2、熟练掌握至少一种深度学习框架,如Pytorch、TensorFlow等,熟悉Megatron、DeepSpeed等主流训练加速框架,有较强的算法工程能力;
3、扎实的算法基础,熟悉自然语言处理相关理论,熟悉Transformer/GPT/LLaMA等基础模型结构,熟悉大模型的微调和评估方法;
4、具备优秀的分析和解决问题的能力,良好的沟通学习及自驱能力;
5、有相关领域学术论文、优秀开源项目、高水平竞赛获奖者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕