职位描述
职责描述:
1、负责大模型算法的研究与开发,包括但不限于 Pretrain(预训练)、SFT(指令微调)、RLHF(强化学习、DPO、PPO)、超长上下文、Function Calling(工具调用)等相关子任务的全流程数据构建等。
2、参与文本大模型和多模态大模型算法的优化和迭代,提升模型性能和效率。
3、跟踪和研究最新的大模型算法技术,将前沿技术应用于实际工程项目中。
4、与团队合作,解决项目中遇到的技术难题。
任职要求:
1、博士及以上学历在校学生,计算机科学、人工智能、机器学习、数据科学或相关专业,211及以上。
2、有扎实的机器学习和深度学习理论基础,熟悉至少一种深度学习框架(如TensorFlow、PyTorch等)。
3、有实际的大模型算法项目经验者优先,包括但不限于预训练、微调和强化学习等方向的技术应用。
4、具备良好的编程能力,熟练掌握至少一种编程语言(如Python、Java等)。
5、有强烈的责任心和团队合作精神,能够在快节奏的工作环境中保持高效率。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕