大模型研发岗JK2214
1.3万-2.5万
上海 本科
上海市徐汇区虹漕路
大模型研究员
岗位要求:
1、负责设计、开发和实现语言模型算法,包括文本生成、语义理解、机器翻译,nl2sql等;
2. 负责预训练模型的训练加速。包括但不限于优化Megatron,DeepSpeed,PyTorch等框架,数据读取,网络通信,计算算子等优化方向;
3、从事语言模型算法训练与调优,不断提升算法精度和模型性能,推动语言模型算法在公司业务场景落地;
4、负责语言模型领域学术研究和前沿方向探索,实现技术突破,并将前沿算法技术转化为创新产品。
任职要求:
1、硕士及以上学历,计算机、数学、自然语言处理、人工智能等相关专业,对语言模型算法有一定理解;
2、对预训练模型技术有一定的理解,对于模型训练、预测、服务化的加速有一定经验;
3、对前沿技术有浓厚兴趣,有较强的学术研究能力,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力;
4、顶级会议或期刊上发表过有影响力的学术论文或在重要算法比赛中取得过优秀名次的候选人优先;
5、参与过大规模语言模型项目及相关产品落地者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕