职位描述
职位描述
1、负责AI项目的部署、集成、调试、优化升级以及后期的运行维护工作;
2、熟悉常见AI框架(如TensorFlow、PyTorch等),能够协助进行环境配置和性能调优
3、输出相关运维文档,提供客户技术支持和使用培训;
4、负责为公司的大模型产品提供技术支持,解决客户在使用过程中遇到的问题,确保产品的稳定运行;
5、收集和整理客户的反馈意见,为产品的改进和升级提供依据,不断优化大模型的性能和用户体验;
6、根据项目需求,进行短期客户现场支持或技术实施工作。
任职要求
学历与专业要求:计算机、人工智能、统计学等相关专业,本科及以上学历;
技术能力要求:
熟悉Kubernetes原理及组件,对其设计理念和工作机制有深入理解,具备独立部署及运维能力;
熟练掌握Docker技术(包括Compose、Swarm集群配置等);
熟练使用Ansible、Jenkins等自动化及CI/CD工具;
精通Linux系统,具有三年以上相关运维工作经验;
熟悉MySQL、Redis、Kafka、MinIO等中间件的安装、配置及集群维护;
硬件相关经验:
熟悉NVIDIA或寒武纪GPU,掌握CUDA或CANN等深度学习环境的安装与调试;
脚本与开发能力:熟练掌握Shell和Python脚本开发,能够快速编写运维工具;
网络与安全:熟悉计算机网络配置,掌握路由器、交换机、防火墙等设备的配置及运维;
加分项:
有开源项目贡献经验;
了解深度学习、计算机视觉等基础知识,具备相关开发或运维背景;
有DevOps相关实践经验;
能够熟练撰写技术文档并具备较强的客户沟通能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕