岗位职责:
1.深入行业,训练行业大模型。
2.主导业务模型开发,业务模型分析等。
3.研发人工智能在行业的落地场景。
任职要求:
统招本科以上学历,数学/统计学相关专业,3-5年以上开发工作经验,
1. 大模型微调和分布式训练:
具备对开源大型预训练模型如BERT、GPT、XLNet等进行微调的能力,以及在分布式环境中训练模型的实践经验。
能够合理设置和调整关键训练参数,如学习率、批大小、epochs等,以优化模型性能和训练效率。
熟练使用分布式训练框架,如Horovod、DeepSpeed等,以加速模型训练过程。
2. 算法设计和实现:
具备独立设计和实现机器学习和深度学习算法的能力,能够根据项目需求设计和调整模型架构,解决特定的NLP任务。
对Transformer架构有深入理解,包括自注意力机制和位置编码,能够根据任务需求调整模型结构。
对BERT和其变体有深入理解,能够进行有效的预训练模型微调,以适应特定的NLP任务。
3. 广泛的模型和算法知识:
了解并熟练应用常用的机器学习、深度学习模型和算法,包括它们的用途和适用场景。
能够根据项目需求选择合适的模型和算法,并进行调优以解决特定的业务问题。
熟练掌握的模型和算法包括但不限于线性回归、逻辑回归、SVM、KNN、前馈神经网络、CNN、RNN、LSTM等。
4. 大模型开发:
具有自然语言处理、检索增强生成、智能代理等领域的理论基础和实践经验。