职位描述
研究deepseek 工作原理,基于开源技术完成小模型蒸馏训练
岗位职责要求
工作职责:
1. 协助进行大模型的开发和优化,包括但不限于模型架构设计、训练算法改进等,重点关注强化学习在大模型中的应用和集成。
2. 参与大模型的训练和调优工作,运用强化学习等技术提升模型的性能和效率,确保模型在各种任务和场景下的稳定性和准确性。
3. 协助进行大模型的评估和测试,运用专业指标和工具对模型进行性能分析,为模型的改进提供数据支持和建议。
4. 跟踪和研究大模型和强化学习领域的最新技术和发展趋势,与团队成员分享和交流,为项目的创新和发展提供支持和建议。
职位要求:
1. 计算机科学、人工智能、机器学习或相关专业的研究生在读学生,具备扎实的数学和编程基础,熟悉 Python 等编程语言。
2. 熟悉大模型训练和调优的基本流程和方法,了解常见的损失函数(如交叉熵)、优化算法(如 SGD、Adam)及其在大模型训练中的应用。
3. 能够运用深度学习框架进行大模型的搭建和训练,具备一定的模型调优经验
4. 对大模型的架构和设计理念有一定了解,能够读懂大模型的相关论文,并能够将其应用于实际的开发工作中。
5. 了解强化学习的基本概念和算法,能够将其应用到大模型的训练和优化过程中,提升模型的决策能力和泛化能力。
6. 具备良好的逻辑思维能力和问题解决能力,能够快速学习和掌握新知识,对挑战性的问题充满热情和耐心。
7. 具有良好的沟通能力和团队合作精神,能够与不同背景的团队成员有效协作,共同完成项目任务。
查看更多职位描述

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕