职位描述
岗位职责
1. 设计、开发和优化预训练大模型的最优方法,以提高其性能和效率。
2. 研究和实现最新的预训练模型架构和算法,并将其应用于解决实际问题。
3. 分析大规模数据集,处理和清洗数据,为预训练模型的训练和评估提供可靠的数据基础。
5. 优化预训练模型的计算和存储效率,以适应不同的部署环境和资源限制。
6. 实施模型的部署和集成,确保模型在生产环境中的稳定性和可扩展性。
7. 跟踪最新的研究进展和行业趋势,持续改进模型算法和工程流程。
任职要求
1. 拥有计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。
2. 具备扎实的编程能力,熟悉Python或其他相关编程语言。
3. 具备深入的机器学习和神经网络领域知识,熟悉常见的预训练模型架构和算法,如GPT、LLaMA等。
4. 具备数据处理和数据清洗的能力,熟悉常见的数据处理工具和技术。
5. 熟练使用深度学习框架,如PyTorch、DeepSpeed等,有丰富的模型训练和调优经验。
4. 熟悉自然语言处理(NLP)等领域的常用技术和算法。
7. 良好的团队合作和沟通能力,能够与不同领域的团队成员合作,解决实际问题。
8. 具备解决复杂问题和快速学习新技术的能力,能够适应快节奏的工作环境。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕