职位描述
一、Kubernetes(K8S)运维
负责企业级 K8S 集群的部署、升级、维护和优化,确保集群的高可用性和稳定性。
管理容器化应用的生命周期,包括创建、部署、调度、扩缩容等。
解决 K8S 集群中出现的各种问题,如网络故障、存储问题、资源瓶颈等。
制定和实施 K8S 集群的监控策略,及时发现并处理潜在风险。
与开发团队合作,提供 K8S 相关的技术支持和培训。
二、PostgreSQL 数据库运维
安装、配置、维护和优化 PostgreSQL 数据库,确保数据库的高性能和高可用性。
制定数据库备份和恢复策略,定期进行数据备份和恢复测试。
监控数据库的性能指标,如查询响应时间、吞吐量、连接数等,及时进行性能调优。
处理数据库故障,如数据丢失、数据库崩溃等,确保数据的安全性和完整性。
负责数据库的安全管理,包括用户权限设置、访问控制、数据加密等。
三、Linux 系统运维
管理和维护 Linux 服务器,包括安装、配置、升级、监控和故障排除。
优化 Linux 系统性能,如内存管理、磁盘 I/O、网络配置等。
负责 Linux 系统的安全管理,包括防火墙配置、用户管理、权限控制等。
安装和配置 Linux 下的各种服务,如 Nginx、Apache、SSH
等。
制定和实施 Linux 系统的备份和恢复策略,确保系统的可靠性。
四、中间件运维
熟悉并维护消息队列(MQ),如 RabbitMQ、Kafka 等,确保消息的可靠传输和处理。
管理 Redis 缓存服务器,进行配置优化、数据备份和故障恢复。
维护 Zookeeper 分布式协调服务,保障其稳定性和高可用性。
部署和管理 ELK(Elasticsearch、Logstash、Kibana)日志分析平台,实现日志的集中收集、存储和分析。
五、其他职责
参与公司 IT 基础设施的规划和设计,提出合理的建议和方案。
编写和维护运维文档,包括操作手册、技术指南、故障处理记录等。
协助开发团队进行应用部署和调试,提供技术支持和优化建议。
关注行业技术动态,引入新的技术和工具,提升运维效率和质量。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕