职位描述
一、大数据运维技术负责人
岗位职责
1. 负责大数据技术平台的基础架构持续优化、负责大数据平台可靠性的能力建设以保障平台稳定运行,负责组织大数据平台重大故障的应急处理及相关应急响应机制、预案的能力体系建设,负责技术大数据平台技术运维、运营团队的组建、管理和能力的建设以保障运维服务目标的达成!
2. 负责组织大数据平台及业务的统一运维体系建设及运营,包括不限于大数据平台的业务连续性保障建设、运维架构建设、监控体系及自动化运维工具体系的建设、运维风险管控等;
3. 负责大数据平台服务保障过程中作业的规范化的、标准化、自动化和智能化的能力、工具、流程的建设,以不断提升大数据平台的服务质量效率并不断地降低保障服务的成本;
4. 负责对大数据平台运行质量及团队的服务能力进行分析及管控,对团队定期开展培训赋能,不断优化服务保障体系,保障技术运营质量保持在行业专业水平之上;
5. 负责运维服务工具的规划、建设、重大运维技术方案的制定和审核,参与产品技术方案的评审,与重要客户开展常态的技术服务沟通并维护好客户关系;
6. 负责大数据平台技术疑难问题解决,大数据技术平台前沿性技术的预研。
任职要求
1. 本科及以上学历,3T专业.
2. 具备10年以上大型大数据平台(千台规模以上)的架构、研发、建设、技术运营服务保障等相关工作经验,精通Hadoop、Hive、Kafka、Flume、HBase、Spark、Flink、Zookeeper等技术,能够处理复杂的技术问题。
3. 熟练多种操作系统、主流大数据技术平台的技术栈, 熟悉大数据平台相关的安全相关体系。
4. 熟悉大数据技术平台的架构与生态,有相关架构设计、研发或运维经验。精通一门及以上开发语言经验Java/Python,有扎实的计算机基础,对数据结构、算法基础有扎实掌握,对计算机体系结构、操作系统、计算机云平台有深刻理解。
5. 掌握分布式计算系统基础理论,文献,熟悉行业内成熟的分布式计算框架与服务,例如Spark、Flink、Doris、Clickhouse等。
6. 精通大数据平台实时计算的稳定性保障及相关的智能运维体系建设,有大规模分布式计算服务研发与技术运营验者优先。
7. 精通大数据运维工具的建设及相关运维流程的打造,有打造大数据平台技术运营服务保障体系的成熟经验。
8. 责任心强,有30人以上团队管理经验优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕