一、岗位描述
模型开发与优化:负责企业级大模型(LLM)的搭建、训练与优化,涵盖后训练、微调、蒸馏等全流程开发,涉及文本内容生成、图像内容生成等领域。
功能拓展:基于业务需求,拓展大模型功能,如多模态交互、知识增强、垂直领域应用等。
系统开发与迭代:参与需求分析、算法部署及全流程测试,持续提升生成效率与业务覆盖率。
技术前沿探索:跟踪 AIGC 生成技术(如 LoRA、NeRF)及产品法规政策变化,推动算法创新。
跨团队协作:与产品、业务团队紧密协作,推动大模型在智能客服、内容生成、数据分析等具体场景中的应用落地。
二、能力要求
(一)技术能力
学历背景:本科、硕士及以上学历,计算机、人工智能相关专业优先。
编程技能:精通 Python,熟悉 PyTorch/TensorFlow 等框架,具有大模型实战经验。
算法知识:熟悉 NLP 与多模态算法,有文本生成、图像生成项目经验者优先。
代码管理:熟练使用 Git 进行代码管理,具备算法部署及性能调优经验。
工具使用:熟悉 Docker/Kubernetes 等工具者优先。
(二)软性素质
跨团队协作:具备跨团队协作能力,能与法务、运营高效沟通。
数据敏感度:对数据敏感,关注细节,能快速响应政策变化。
(三)加分项
有 AIGC 内容安全、电商业务相关项目经验。
具备跟踪学习前沿技术发展的能力,有 deepseek 的深入应用以及 huggingface 上各种开源项目的应用经验。