职位描述
岗位职责:
1、参与语言、视觉、音频、多模态等大模型的训练与微调算法的设计、开发和优化,以满足特定业务场景需求。
2、负责大模型的部署、适配、推理加速、Prompt调优与应用落地等工作。
3、研究与跟进大模型相关领域的最新进展和前沿技术,以支持模型的创新和优化。
任职要求:
1、硕士及以上学历,计算机、软件工程、人工智能等相关专业,有深度学习和LLM算法研发和项目经验者优先;
2、具备一定NLP、CV相关领域的基础知识和动手能力,对大模型有着浓厚兴趣,愿意长期从事大模型相关工作的研究;
3、熟练掌握Python/C++等编程语言,熟练使用Pytorch、Transformers、LangChain、DeepSpeed、FastAPI等框架;
4、熟悉常见大模型的技术细节和训练方法,包括但不限于LLaMA、ChatGLM、Qwen、BaiChuan等模型;
5、熟悉Prompt Engineering,具备一定的Prompt编写和调优的能力;
6、具有良好的责任意识、团队精神和沟通表达能力;
7、具有较强的英文阅读理解能力,能熟练阅读和撰写英文资料,发表过SCI期刊论文者优先考虑。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕