岗位职责:
负责行业大模型的研发与优化任务,根据场景选择合理的技术架构路线并进行全生命周期的架构落地,包括但不限于:大语言模型架构设计,训练优化,性能评估,提升模型语义理解、指令遵从、逻辑推理等通用能力;基于大语言模型的检索增强技术研发,包括大模型领域适配、知识对齐、知识增强等;大规模数据的收集,清洗,预处理工作,为模型训练提供高质量数据支持;运用多模态(图片,语音,视频等)生成算法模型解决行业问题
任职要求:
1、教育背景:计算机科学、人工智能、数学等相关专业硕士及以上学历,至少5年以上相关工作经验,有大型互联网公司或AI创业公司算法架构设计经历者优先。
2、专业技能与知识:
精通常见的机器学习/深度学习算法原理及其在实际场景中的应用,如神经网络、SVM、决策树、随机森林等。
具备扎实的编程基础,熟练掌握Python、C++等编程语言,对TensorFlow、PyTorch等主流深度学习框架有深入理解和实战经验。
熟悉分布式计算框架(如Spark、Hadoop)及GPU加速计算,具备高性能算法实现能力。
3、解决问题与创新能力:
具备优秀的逻辑思维能力和独立解决问题的能力,能够针对复杂业务场景提出有效的算法解决方案。
具备良好的科研素养和探索精神,持续关注并研究国内外最新算法理论和技术趋势。
4、团队领导与沟通能力:
具备优秀的人际沟通能力和团队协作精神,能有效地组织和指导团队完成研发任务。
具备较强的技术影响力,能够激发团队成员的技术热情和创新意识。
5、其他素质:
对于云计算、大数据处理等领域有一定的了解和实践经验;
英语读写流利,具备良好的英文文献阅读和理解能力。