岗位职责:
1.参与大模型项目建设工作,推进实现项目目标;
2.负责大模型相关软硬件技术的评测、引入和研发工作;
3.负责大模型平台的搭建、软硬件适配及模型调优工作;
4.负责大模型相关应用产品的研发工作;
5.负责部门交办其他事项与项目。
任职要求:
1.3年以上工作经验;
2.计算机类、数学类相关专业本科及以上学历;
3.具有扎实的NLP算法基础,深入理解大语言模型(GLM/LLAMA/GPT等)实现原理,具备追踪、学习、应用国内外前沿大模型技术的能力,熟悉深度学习开源框架(如tensorflow,pytorch等);
4.具备完整的大模型相关应用落地经验,深度参与语料收集清洗、模型网络结构设计、微调训练、效果评估等关键流程。具备良好的产品思维和技术品味,针对具体应用场景能够独立设计解决方案并推进落地实施;
5.具有丰富工程经验,掌握Python等编程语言,熟悉Linux和docker开发环境,有部署生产级别AI应用经验;
6.乐观向上,责任心强,具备较强沟通技巧和团队合作精神;
7.具有较好的文案写作能力和表达能力;
在各类LM/NLP/CV顶会上发表过论文或申请过相关专利者优先考虑。