职位描述
岗位内容:
1.参与大规模预训练语言模型的开发、训练、优化和部署。
2.研究和实现前沿的自然语言处理算法,如文本生成、机器翻译、问答系统等。
3.设计和开发高效、可扩展的模型训练和推理框架。
4.优化模型性能,包括速度、精度和资源消耗。
5.与产品经理、数据科学家和其他工程师合作,将模型应用于实际场景。
6.跟踪学术界和工业界的最新进展,并将其应用于实际工作中。
任职要求:
1.计算机科学、软件工程、人工智能或相关专业本科及以上学历。
2.扎实的编程基础,熟练掌握 Python、C++ 或 Java 等编程语言。
3.熟悉常用的深度学习框架,如 TensorFlow、PyTorch 等。
4.了解自然语言处理的基本概念和常用算法。
5.有大规模分布式系统开发经验,有 GPU 编程和优化经验,熟悉 Transformer、BERT、GPT 等预训练语言模型。
6.具备良好的沟通能力和团队合作精神。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕