职位描述:
1. 负责国内与海外车联网应用发版、OTA 及发布会活动保障,响应并解决用户问题;
2. 负责云上基础组件的容量管理、灾备管理及故障预案,提升服务SLA标准;
3. 负责 k8s 容器集群版本升级任务并负责相关问题的排查与解决;
4. 优化监控告警系规则及编写运维SOP手册;
5. 负责撰写故障及安全隐患处理报告,给出改进建议及预防措施;
职位要求:
1.大专以上学历,计算机、网络、电子等相关专业;
2.熟悉Linux系统基本操作,能使用Shell, python进行脚本编写;
4.熟悉常用监控工具如prometheus,grafana, open-falcon 的基本操作;
5.有强烈的工作责任心和沟通能力,有良好的服务意识与团队合作精神;
6. 熟悉阿里云、AWS、腾讯云等云平台的运维经验者优先;