大模型应用开发工程师
【工作职责】
1、基于常见开、闭源大模型,构建垂域生成式大模型能力,包括但不限于模型设计、prompt优化、预训练、微调、RAG、Agent研发、模型加速等,解决训练和离线推理过程中的技术和性能问题。
2、跟进解决相关业务问题,将大模型应用于政务领域,实现知识问答、数据分析、关联推理、智能计算,确保项目按时、高质量交付。
3、跟踪调研大模型的前沿技术,深入探索大模型的市民卡、工会、旅游等垂域应用场景,推动技术创新。
4、应用场景创新: 分析并识别新的应用场景,设计并实施模型优化策略,确保模型能够有效解决复杂问题。
5、智能体开发与优化: 参与智能体项目的设计、开发与迭代,提升智能体的交互体验、理解能力和自主决策能力。
6、技术研究与分享: 跟踪最新的大模型技术动态,进行内部技术分享,提升团队整体技术水平。
【任职要求】
1、本科及以上学历,AI、计算机相关专业毕业,或有大语言模型应用落地经验,具备良好的算法实现能力。
2、熟悉Java、C++或Python编程开发语言,熟悉分布式应用架构和主流中间件技术等,熟悉性能分析和优化等。
3、熟悉基础的机器学习理论及常见的预训练模型;熟悉常见的向量模型、大语言模型及相关技术。
4、掌握预训练、微调、提示语工程、RAG技术、Agent等技术原理,具备相关流程开展经验。
5、具备私有化模型部署能力,熟练掌握LangChain、DeepSpeek等开发框架。
6、具备良好的沟通和团队协作能力,积极主动学习能力&技术深入探索能力。
工作时间:早九晚五,双休,节假日正常放假