职位描述
工作职责:
1. Kong 网关的日常维护与管理:
负责 Kong 网关的部署、配置、升级和性能调优,确保其高可用性和稳定性。
监控 Kong 网关的运行状态,及时发现并解决潜在问题。
开发和维护 Kong 网关插件,满足业务定制化需求。
2. 系统稳定性建设与提升:
参与核心交易链路的稳定性提升,构建系统的灰度等能力。
制定并实施系统监控、报警和应急响应策略,提升故障发现和处理效率。
进行容量规划和性能测试,提升系统的弹性和可扩展性。
3. 故障排查与问题解决:
快速定位并解决生产环境中的系统故障和性能瓶颈,尤其涉及Kong网关,保障T0链路的可用性。
总结故障经验,完善故障预案与知识库,持续改进系统稳定性。
4. 协作与支持:
与开发、测试等团队紧密合作,推动DevOps实践落地。
l 为团队提供技术支持和培训。
任职要求:
1. 工作经验:
5年以上SRE或运维相关工作经验。
熟悉kong网关的架构和原理,具有实际的维护和开发经验。
2. 技术技能:
精通kong网关的安装、配置、调优和插件开发,熟悉Lua编程。
熟悉API网关和微服务架构,了解Nginx、OpenResty等技术.
熟练使用Linux系统,具备Shell、Python等脚本编程能力。
熟悉容器化技术及其在微服务中的应用。
了解常用的监控和日志系统(如Prometheus、Grafana、ELK)。
有系统稳定性体系建设经验,熟悉熔断、降级、限流等高可用涉及。
具备故障预防、监控报警、应急响应等实践经验。
具备良好的沟通协调能力和团队合作精神。
具备较强的问题分析和解决能力,思路清晰,责任心强。
3. 加分项:
l 有大型在线交易系统的SRE经验者优先
l 熟悉DevOps理念,具备Java、GO等语言的开发经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕