职位描述
工作内容:
1.机翻模型迭代:针对不同语种,进行数据迭代、模型优化,提升现有模型的翻译质量;
2.模型结构优化:利用网络结构搜索算法,基于现有的一些优化方式如相对位置编码、pre-norm、跨层连接等,优化自有的tranformer模型,探索更优的机翻模型架构;利用模型剪枝、算子融合等方式,优化自有的部署模型结构,实现高质量的快速推理;
3.训练方式优化:利用课程学习、增量微调等方式,优化全量训练、微调训练方法,提升低资源语种上的翻译质量;迁移其他领域的训练方法到机翻领域,实现机翻主流语种的质量持续提升;
4.大语言模型训练:熟悉大语言模型的训练、部署和优化,至少在一个大语言模型上进行过全参微调或重新训练;
任职要求:
1.基础开发能力,熟悉python、c++、java等多门编程语言,熟悉pytorch、tensorflow等深度学习框架,熟悉cuda开发;
2.背景要求:计算机、人工智能领域相关硕士及以上学历,大厂四年以上NLP算法工程师优先;
3.学术要求:在ACL、 NIPS等AI领域顶会上以一作或者学生一作发表过论文;
4.算法能力:需要具备扎实的数学基础和深度学习算法的实践经验,能够独立完成算法的设计、实现和优化,对Transformer模型:Bert、GPT等完成过模型结构优化或训练方法优化;对Pytorch底层算子实现比较熟悉,了解现有的一些针对tranformer模型进行算子优化的方法;有C++和cuda算子实现的经验;
5.团队能力:具备良好的沟通能力和团队协作精神,有一定的项目管理能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕