职位描述
一、岗位职责
1、专注于对各类综合任务场景的评估,包括但不限于总结摘要、电商复杂流程sop等需要多步流程交互的复杂场景。
2、参与制定综合任务题目的参考答案和评估标准制定,掌握复杂流程型任务的特点。
3、与算法团队、产品、标注团队等密切协作,深度理解项目在综合任务方向的特定,能够协助算法团队定位模型推理流程的弱点,提供数据构造的意见。
4、语感好,阅读长文能力强。
二、任职要求
1、本科一本及以上学历(985、211优先),理科背景优先(不一定),逻辑性好,语言能力强者优先。
2、具有 LLM 数据评估经验,熟悉 LLM 数据评估的流程和方法优先,最好在数理逻辑、综合任务等LLM方向有过评估经验。
3、对新技术和新领域保持强烈的学习热情,能够快速适应不断变化的评估任务和要求。
4、工作细致认真,责任心强,具备优秀的团队协作精神和良好的沟通能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕