岗位职责:
1. 运营战略制定:制定算力调度系统的运营战略,确保系统能够高效稳定运行,并为公司业务提供强大支撑。
2. 日常运营管理:监督和管理系统的日常运营工作,确保系统的高可用性和资源的最优配置,及时响应和处理突发事件。
3. 资源调度优化:持续分析资源使用情况,优化资源调度策略,最大化资源利用率,降低运营成本。
4. 团队管理:组建并管理算力调度运营团队,培养团队成员的专业技能,提升整体运营效率。
5. 用户支持与服务:建立和维护与内部用户(如开发团队、数据科学家等)的良好沟通,及时解决他们在算力调度系统使用中的问题。
6. 监控与报告:建立系统监控机制,定期分析系统运行数据,生成运营报告,并提出改进建议。
7. 供应商与合作伙伴管理:与相关技术供应商、合作伙伴保持良好关系,确保系统组件和服务的稳定供应与支持。
8. 风险管理:识别和管理运营中的潜在风险,制定应急预案,确保系统的稳健运行。
岗位要求:
1. 教育背景:管理学、计算机科学或相关领域的本科及以上学历,MBA优先。
2. 工作经验:至少10年以上IT运营管理经验,其中包括3年以上分布式系统或云计算平台的运营管理经验。
3. 管理能力:出色的团队管理和领导能力,能够高效组织和协调各部门的工作。
4. 技术理解:对算力调度、云计算、分布式系统有较深入的理解,能够有效指导团队的技术运营工作。
5. 战略思维:具备制定和实施运营战略的能力,能够在复杂环境下做出合理决策。
6. 沟通与协调:优秀的沟通能力,能够在多部门和外部合作伙伴间进行有效协调。
7. 数据分析能力:具备较强的数据分析能力,能够根据系统运行数据提出优化建议。
8. 应急反应能力:能够在突发事件中迅速反应并采取措施,确保系统稳定。
注:此岗位为第三方用工,入职后与第三方公司签约