工作职责
1.负责模型训练、效果优化、模型评估、部署、调用和监控工作;
2.熟悉 Prompt 工程,能够撰写对话和赋能团队成员;
3.掌握大模型的 Langchain 框架相关技术;
4.独立系统分析设计文档编写能力和 Agent 架构设计能力,以达到 Agent 应用 + 模型意图效果;
5.设计和构建数据集,进行模型训练和调优,以满足业务需求的目标;
职位要求
1.本科以上学历,计算机相关等 3T 专业,精通 Python 与 Java 编程语言;
2.精通 RAG 技术,精通大模型 Prompting 工程与 Agent 开发;
3.熟悉使用向量数据库(如 FAISS、Milvus、Annoy 等),能够处理大规模向量数据;
4.熟悉知识召回和 Rerank 模型优化算法,LoRA 模型微调,有对话系统、自然语言处理(NLP)项目经验;
5.扎实的 NLP 理论基础,对 CNN、LSTM/GRU、Transformer、BERT 等 NLP 基础技术有深入了解。
6.熟悉vLLM等推理框架
7.有大模型训练与微调经验,包括 RLHF(强化学习人类反馈),以及对话系统开发背景优先;