职位描述
1、负责设计、开发和优化计算专用GPU软件栈,包括Runtime和驱动等;
2、负责根据AI与通用计算的应用需求,为GPU计算软件栈引入新的特性;
3、负责协同编译器和内核态驱动团队,在不同平台下适配驱动和Runtime并做性能优化;
职位要求
1、计算机相关专业,本科及以上学历, 5年以上相关工作经验;
2、熟悉CUDA或ROCm软件栈,有丰富的生态兼容、计算库移植开发经验;
3、熟悉至少一种异构计算编程体系,如:CUDA、HIP、SYCL、OpenCL等;
4、熟悉类CUDA Runtime和Driver API及其底层实现,熟稔Event、Stream等机制;
5、熟悉C/C++编程,有良好的编程习惯和较强的问题解决能力;
6、有很好的团队协作能力与沟通能力,对技术和代码品质有追求;
工作地点:上海,武汉