职位描述:
1、负责全网容器服务集群的实施、维护、故障排查等工作(调度、网络、GPU、监控、日志等)。
2、负责行业专属大模型统一管理平台的资源调度,如平台资源开通、调度扩缩容等。
3、负责行业专属大模型统一管理平台的运行维护,如平台资源监控、事件监控、性能分析、巡检诊断等。
4、协助团队项目日常维护、持续学习和分享云原生领域的前沿技术。
5、公司安排的其它相关工作。
任职要求:
1、统招计算机科学、软件工程等计算机相关专业,1-3年以上工作经验,至少熟悉Go/Python一门语言。
2、熟悉Linux/Unix操作系统和操作命令,包括:tcpdump,iptables等工具的安装配置和使用。
具有扎实的虚拟化、容器、网络等云计算平台底层技术基础。
4、熟悉K8S或OpenStack的平台,有公有云(阿里云、华为云、腾讯云)或混合云项目研发与实施经验优先。
5、具有相关的线上问题系统化的分析能力,性能调优经验,能独立定位和解决业务系统接入容器云平台的各种问题。