职位描述
岗位职责:
1. 负责盘古大模型的训练与推理效果优化,包括但不限于数据处理、预训练、指令精调、RLHF、推理优化等;
2. 对现有算法、数据进行分析和评估,优化模型生成效果,减少有害、敏感或偏见相关回复;
3. 调研并探索LLM方向相关前沿算法,如位置编码、模型结构等,持续提升现有算法的效率与效果;
4. 大模型技术方案设计和相关技术的落地验证;
5. 跟踪行业内前沿技术,保证业务中算法先进性。
任职要求:
1. 气象、大气科学、卫星遥感、海洋、计算机、人工智能等相关专业硕士及以上学历,5年以上工作经验;
2. 精通TensorFlow/PyTorch/Megatron等深度学习训练或推理框架底层原理,熟悉3D并行训练技术原理;
3. 对大模型有技术热情,熟悉GPT/BERT/llama/GLM等模型的结构和原理;
4. 熟悉盘古大模型基本原理及应用,具备千亿级别参数大模型设计、研发或调优经验;
5. 主导过自然语言算法或语言大模型(大于300亿参数)方向研发工作,或发表过相关顶会、期刊论文;
6. 责任心强,有较强的自驱力,善于利用业界优质模型,从0到1推动业务发展,以及较强的沟通协作能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕