岗位职责:
1、不断优化线上环境,对我们生产环境的稳定性负全部责任。
2、设计、实施和管理持续集成和持续交付 (CI/CD) 系统和方法,以支持 24/7 关键任务环境。
3、制定自动化策略,使用尖端的 DevOps 工具增强我们多个站点的部署和监控能力。
4、监督和优化我们广泛的云基础设施,确保跨多个平台(包括 Azure、AWS 和 Google Cloud)高效地调配、配置、自动扩展和管理计算资源。
5、主导Docker、Kubernetes、Openshift等容器化和编排技术的实施和运营,确保高可用性和灾难恢复能力。
6、密切监控系统性能指标,响应事件,主动排除故障并解决关键问题,以保持卓越运营。
7、执行严格的安全协议并确保遵守所有相关的行业标准和法规。
8、带头制定严格的值班轮换计划,要求灵活地随时解决紧急问题,包括晚上、周末和节假日。
岗位要求:
1、拥有计算机科学、工程或相关技术领域的学士学位,并在高增长的技术环境中拥有至少 5 年 DevOps 或系统工程职位的经验。
2、掌握软件开发生命周期,重点关注 CI/CD 实践; 熟练掌握Golang、Python、Shell等编程和脚本语言。
3、拥有管理大型云环境(Azure、AWS、Google Cloud)的专业知识,拥有 Terraform、Ansible 和 Saltstack 等高级配置管理工具的实践经验。
4、深入了解 Docker、Containerd、Kubernetes 和 Openshift,在部署可扩展、安全的容器化应用程序方面拥有良好的记录。
5、卓越的分析能力和解决问题的能力; 能够在紧迫的期限内管理多个项目,并承受最大的压力。
6、英语可作为工作语言,出色的口头和书面沟通技巧对于跨职能协作和执行报告至关重要。
优先资格:
1、Azure、AWS、Google Cloud、Kubernetes 或相关 DevOps 工具的认证。
2、拥有领导重大基础设施项目的悠久历史,重点关注可扩展性、安全性和可靠性。
3、拥有自动化安全性和合规性方面的经验,特别是在受监管的行业。
4、该职位需要承诺按需工作安排,并能够在动态和充满挑战的环境中同时处理多个高风险项目。