【岗位职责】
1.负责大模型产品线相关算法模型的研究及实现工作,包括但不限于:深度学习,强化学习,计算机视觉,大模型/多模态大模型后训练及微调,文本及图文多模态场景下的指令跟随、复杂推理学习等;
2.配合完成自研大模型的数据处理、模型训练微调及场景落地等工作,并支持业务及产品功能开发;
3.参与实验室及中心相关执行项目的技术方案对接,提供技术或解决方案支持;
4.项目相关文档撰写和维护,项目相关代码、工程维护。
【任职条件】
1.教育背景:硕士及以上学历,人工智能等相关专业优先(计算机、数学、认知科学等)。
2.工作经验:3年以上相关工作经验。
3.能力素养:
-熟悉大模型及AI相关研究工作和算法,熟悉本领域最新技术研发趋势,具有深度学习、大模型/多模态大模型相关项目或研究经验,拥有高影响力期刊或会议论文、知名竞赛获奖、知名公司机构工作经验者优先;
-熟练掌握pytorch等深度学习框架,熟悉大模型训练/微调相关代码库,具备优秀算法实现和代码优化能力,具有分布式训练、多模态大模型训练/微调以及相关底层代码库优化经验者优先;
-目标导向,具备优秀的问题提出、分析和解决能力,良好的团队协作精神和沟通意识;
-具有极强的主观能动性和专研精神,工作细致负责,沟通能力良好。