初级:
1. 计算机、人工智能、自然语言处理、数学、统计学等相关专业,本科及以上学历;
2. 1年以上NLP或大模型相关算法经验,具有一定的自然语言处理领域的理论基础;在指导下能参与实现相应系统子模块的开发工作,比如多模态内容生成、智能客服等应用;
3. 了解机器学习、深度学习理论和算法知识和Transformer模型架构,了解TensorFlow、PyTorch等深度学习框架;了解常用的优化算法,掌握梯度裁剪、混合精度训练等技巧;
4. 掌握Python,熟悉使用Java、Scala中至少一门编程语言。
中级:
1. 计算机、人工智能、自然语言处理、数学、统计学等相关专业,本科及以上学历;
2. 3年以上NLP或者大模型领域相关经验,能够紧跟前沿论文中涉及的技术,理解机器学习、深度学习理论和算法知识和Transformer模型架构,具有一定的论文复现能力;
3. 能参与设计系统应用,独立负责核心子模块的设计、开发工作,比如多模态内容生成、智能客服等应用;
4. 熟练使用TensorFlow、PyTorch等深度学习框架,能根据业务需求使用BERT、GPT等框架解决实际问题;理解常用的优化算法,精通梯度裁剪、混合精度训练等技巧;掌握大模型微调(fine-tuning)原理和方式;
5. 对大规模数据处理和分布式训练有一定的经验,了解GPU、TPU等硬件加速器的使用和优化;
6. 精通Python,熟悉使用Java、Scala中至少一门编程语言。
高级:
1. 计算机、人工智能、自然语言处理、数学、统计学等相关专业,本科及以上学历;
2. 5年以上NLP或大模型相关算法经验,能够紧跟前沿论文中涉及的技术,深度理解机器学习、深度学习理论和算法知识和Transformer模型架构,具有较强的论文复现和改造能力;
3. 能主导设计并实现复杂的系统应用,比如多模态内容生成、智能客服等应用;
4. 对大规模预训练语言模型有深入理解者和开发经验者优先,具有较强的算法问题解决能力;
5. 熟练使用TensorFlow、PyTorch等深度学习框架,熟练掌握并且能够根据业务需求对BERT、GPT等框架进行fine-tuning;精通常用的优化算法,精通梯度裁剪、混合精度训练等技巧;精通大模型微调(fine-tuning)原理和方式;
6. 对大规模数据处理和分布式训练有丰富的经验,掌握GPU、TPU等硬件加速器的使用和优化;能够分析并解决在训练和推理中的性能瓶颈或故障,能够优化模型推理的资源利用率。
7. 精通Python,熟悉使用Java、Scala中至少一门编程语言。