岗位职责:
负责大模型Large Language Model(LLM)技术在多个业务场景落地的核心技术攻坚,提升内外部用户的服务效率和服务体验,岗位职责包括但不限于:
1. 负责基于通用基座大模型结合领域数据构建领域模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚;
2. 深入服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决领域实际业务需求;
3. 探索 Transformer 模型在其他领域的应用。
岗位要求:
1. 计算机科学、软件工程、数学、统计学等相关专业,本科及以上学历;
2. 具备独立的从业务需求到算法工程转化和落地能力,在自然语言理解NLU/自然语言生成NLG、对话机器人、搜索推荐、知识图谱等一个或多个领域有大规模场景落地经验;
3. 在大模型LLM相关技术方向有实战经验者优先,比如LLM训练和优化、搜索增强生成RAG、大模型推理以及大模型评估等一个或多个方向有实际经验;
4. 熟悉掌握Python/Java/C++中至少一门语言,熟练掌握至少一种深度学习框架(PyTorch、TensorFlow、Caffe等);
5、有相关算法比赛(Kaggle等)获奖经验的同学优先。