岗位职责:
负责确保计算机系统、服务器、网络、存储系统以及其他IT基础设施稳定、安全、高效运行。工作范围包括各个区域中心机房运维,以及数据中心的监控系统迭代升级,具体岗位职责如下:
1.系统监控与维护:利用监控工具(如Zabbix、Prometheus、Grafana等)对服务器、网络、应用程序等进行实时监控,及时发现并解决潜在的性能问题、安全漏洞或故障,确保系统稳定运行。
2.故障排查与解决:当系统发生故障时,快速响应请求,迅速定位问题根源,制定并执行解决方案,恢复系统正常运行。
3.系统部署与升级:根据业务需求,参与或负责系统架构的设计、部署、配置及升级工作,包括操作系统、中间件、数据库、应用程序等的安装、配置和更新。
4.自动化与脚本编写:为了提高工作效率,编写或利用现有的自动化脚本和工具(如Ansible、Puppet、Docker、Kubernetes等)来自动化日常运维任务,如部署、备份、恢复等。
5.容量规划与优化:根据业务增长趋势,评估系统资源(如CPU、内存、存储、网络带宽)的使用情况,制定容量规划方案,并对现有系统进行优化,以提升性能和降低成本。
6.安全与合规:确保系统符合安全标准和行业法规要求,包括但不限于配置防火墙、入侵检测/防御系统、数据加密、访问控制等安全措施,以及定期进行安全审计和漏洞扫描。
7.文档编写与知识管理:编写和维护系统操作手册、故障处理指南、维护日志等文档,确保团队成员能够快速上手和解决问题,参与或组织技术培训,提升团队的整体技术水平。
8.跨部门协作:与相关部门紧密合作,理解业务需求,为系统提供稳定的技术支持,并参与项目规划和评审,确保IT服务能够满足业务需求。
9.应急响应与灾难恢复:制定并实施应急响应计划和灾难恢复策略,确保在突发事件发生时能够迅速恢复系统正常运行,减少业务损失。
任职要求:
1.学历: 本科,计算机相关专业。
2.40周岁以下,8年及以上工作经验,5年及以上大型企业运维工作经验,具备深厚的Windows与Linux系统运维经验。
3.具有微软、甲骨文中级及以上认证
4.具备能力: 精通Oracle、MySQL、SQL Server等主流数据库的维护与管理;熟练掌握Citrix云桌面解决方案、VMware虚拟化技术、服务器配置与优化、高效数据存储与备份策略;精通Zabbix等主流监控系统,以实现对系统性能的实时监控与问题预警;掌握准入控制系统,确保网络访问的安全性;能够提供全面的桌面支持服务,解决终端用户面临的各种问题;具备运用CMD、VBS、Python、Powershell、Shell等多种脚本语言的能力,以实现日常运维任务的自动化,提升工作效率;具备系统及应用层面的漏洞检测与修复能力,确保环境的安全性;应至少精通一种编程语言,并具备将编程技能应用于系统或应用开发的能力,能够解决复杂的运维难题、推动技术创新与效率提升及持续的学习与创新能力,以应对日益复杂的IT环境挑战。