职位描述
职责描述:
1、负责大模型数据工程过程的开发;
2、深入了解业务场景,结合实际业务数据,完成数据挖掘模型、人工智能模型大数据数据工程平台的搭建与调优;
3、负责搭建大数据平台,用于大模型训练数据的格式预处理、数据清洗、脱敏过滤、样本评估;
4、负责产品的相关技术需求分析,撰写业务相关技术材料;
5、有持续学习的能力;喜欢开源软件,乐于知识分享;对工作认真负责;可以独立承担较大工作压力。
任职要求:
1、硕士以上学历,数学、计算机相关专业毕业。应届生或具有2年以上大数据或数据挖掘、人工智能相关工作及项目经验。具有良好的数据分析能力和问题解决思路,能够快速理解业务及数据特点。
2、使用大数据相关的技术(Hive、hadoop、hdfs)解决业务相关问题;
3、理解 HDFS 体系架构,并能给予Hive、HDFS、python、R、Spark、Zeus等工具构建离线系统;
4、利用大数据平台实现对数据的分析和处理;
5、负责各类离线系统的业务调研,并与公司其他部门负责沟通协调;
6、负责离线系统中数据处理工作(数据采集、清洗、汇总、集成等);
7、负责协助完成离线系统中数据上下层衔接处理工作;
8、负责各类离线系统的开发、部署等工作;
9、能够独立完成数据获取、数据清洗、业务场景分析、数据模型建立、数据模型训练优化、数据模型应用评估等全流程工作者优先。
10、能接受中长期出差优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕