职位描述:
1. 负责机器学习/深度学习算法的技术预研与实现,优化模型效率,持续进行业务效果闭环优化;
2. 熟悉大模型常用微调方法、推理加速方法、模型部署等;
3. 参与大数据平台产品智能化建设,聚焦于自然语言处理相关领域,包括数据资产检索、大数据智能运维、Text2SQL、知识图谱构建等;
4. 负责Text2SQL领域的数据集构建、模型训练和微调,持续优化模型性能和落地效果;
5. 跟踪和分析AI方向最新研究成果和技术动态,如Text2SQL、RAG、agent等,以提升模型性能和效率;
6. 开发和优化大模型算法,确保技术实现符合项目要求;
7. 与团队合作,针对特定任务设计和实施有效的算法解决方案。
职位要求:
1. 本科及以上学历,计算机、数学、电子信息、人工智能等相关专业背景;
2. 具备良好的数学基础及Java研发能力;
3. 具备扎实的算法基础和丰富的算法落地经验,具备较强的研发能力及经验;
4. 熟悉NLP算法,熟练掌握TensorFlow、PyTorch等机器学习框架,能够独立完成业务场景适配;
5. 熟悉NLP相关任务,对文本分类、语义分析、文本生成、NER等至少一方面有经验;
6. 了解BERT/GPT/GLM/Bloom/LLaMA/Mixtral等主流模型,具备相关调优设计经验;
7. 对大模型/AIGC兴趣浓厚,对AI前沿保持敏锐洞察力,熟悉大数据领域智能化发展方向和技术或工具;
8. 熟悉多模态学习、大规模预训练等;
9. 具备良好的团队合作精神和沟通技巧,能够适应快速变化的业务需求。
10. 具备优秀的分析及解决问题能力、逻辑思维能力、沟通协作能力,保持对新事物的好奇心,责任心强,诚信可靠。