职位介绍:
1、灾备方案制定:需针对各类可能的状况制定应急预案,保证平台可用性。
2、系统性能优化:根据平台资源使用情况,给出针对性的优化建议,使平台能够尽可能满足各类应用的需要。
3、疑难问题诊断:能够及时地定位问题原因,并给出解决方案。
4、日常监控:监控平台各组件地运行状况,及时发现问题。
5、集群维护:包括扩/缩容,平台各组件升级等。
6、权限管理:平台新接入平台时地账号创建与权限分配。
任职资格:
1、2年以上大数据平台运维经验。
2、有数字化建设经验,具备编程能力优先。
3、有较强信息收集与分析整理能力、学习能力、问题排查能力。
4、熟悉Hadoop、Hive、Kafka、Spark等大数据组件功能工作原理。
5、至少掌握一种主流脚本能力(Shell、Python)。
6、熟悉Zabbix等监控管理工具(有相关开发经验优先)。
7、能熟练部署、维护、优化Nginx/Tomcat/ MySQL/Redis等应用。