岗位职责:
1. 根据公司产品业务,负责基于开源基座LLM的部署和微调,实现工程行业应用落地;
2. 设计开发行业垂直大模型,结合应用场景特点,进行大模型训练工作;
3. 持续关注 LLM 领域的最新进展,将新技术和方法应用到产品项目中;
4. python功底扎实,会使用大语言模型应用开发框架进行应用开发。
岗位要求:
1. 本科及以上学历,硕士学历优先。人工智能、计算机、数学等或相关专业;
2. 扎实的机器学习,深度学习,自然语言处理等领域理论知识;
3. 熟悉主流的深度学习框架,如TensorFlow、PyTorch等;
4. 熟练使用开源大语言模型,如LLaMA2、Mixtral-7B、ChatGLM等,并且深入理解背后原理与相关训练方法;
5. 会使用Langchain、LlamaIndex等大语言模型端到端应用程序开发框架进行应用开发;
6. 良好的解决问题能力和团队协作能力,乐于攻克技术难题;
7. 优秀英文文档阅读理解优先。