职位描述
工作职责:
基于多模态数据构建大模型数据治理体系,利用大模型进行数据增强,通过prompt、微调等方式构建画像大模型,实现用户深度理解,为用户提供自动化和个性化服务,并进行产品落地,该职位的主要职责包括:
1、负责大模型数据基础设施建设,包括不限于:多模态数据、非结构化文本等数据的采集、清洗、处理、存储,以及训练和评测数据集构造;
2、负责不同领域高质量知识库构建,通过大模型prompt设计及完善,使得大模型输出预期结果;
3、负责text2sql等智能报表数据分析,提高日常分析效率;
4、紧跟前沿技术,参与大模型Agents关键技术研究和突破。
任职要求:
1、扎实的编程功底,精通Python、Java等编程语言,熟练使用sql、linux,熟悉各类型数据库使用,包括不限于hive、mongo、图数据库以及向量数据库,熟悉PyTorch、TensorFlow等深度学习框架;
2、熟悉大模型的使用和微调,包括但不限Prompt、RAG、SFT、RLHF等,以及text2sql等;
3、熟练掌握自然语言处理、机器学习和深度学习等知识和技术;
4、具备独立阅读英文文献和撰写英文论文的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕