职位详情
大模型训练微调工程师
1.8-3.5万
航天科工(北京)空间信息应用股份有限公司
北京
不限
硕士
04-16
工作地址

北京总部基地12区3号楼

职位描述
岗位职责
1、负责大语言模型预训练算法和底层原理研究;
2、负责大语言模型在垂直领域的微调、蒸馏等方法研究与实现;
3、负责大语言模型与视觉模型的结合应用研究与实现;
4、负责大语言模型与知识图谱技术的融合研究与实现;
5、负责大语言模型在具体业务场景中的应用落地。

任职资格
1.计算机科学或人工智能等相关专业,硕士及以上学历;
2.NLP、大语言模型等研究方向,信息挖掘、知识图谱等相关领域;
3.编程功底扎实,熟练使用C++或Python等编程语言;
4.熟练使用常用的深度学习框架,如TensorFlow、PyTorch等;
5.熟悉主流大语言模型(GPT/T5/PaLM/LLaMA/GLM等)的原理和训练方法,对模型设计和适用场景有深入的理解;
6.熟悉大语言模型训练、微调和优化策略,如高质量数据清洗、模型质量评估、Pretrain、SFT、RLHF等;
7.熟悉利用大语言模型进行知识图谱的构建和融合;
8.熟悉利用大语言模型进行业务应用构建的相关技术,如:LangChain、向量数据库等。
9.具有分析问题和解决问题的能力,能够自我驱动,具有良好的团队合作精神,较强的沟通能力。
加分项:
1.具备大模型预训练,文本生成,多轮对话、知识图谱、常识推理、推荐搜索、多模态理解、信息检索等方面实践经验者优先。
2.有大规模分布式训练部署等经验优先。

查看更多职位描述

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请