工作内容:以既定评估标准,借助传统搜索质量评估手段进行人工评估,来量化模型效果。简言之,对模型生成的回复进行打分,以区分回复质量的优劣。
岗位要求:
1. **学历要求**:一本及以上学历,英语专业8级,有二外(韩/日/西班牙语)者优先
2. **个人素质**:具备敏锐的洞察力、快速学习能力、执行力,接受重复度高的工作,细心踏实、聪明好学。
3. **技能要求**:专8或同等水平,有一年以上留学经验或有英文读物编辑,文学作品翻译爱好等,最好同时有创作相关背景(文学、新闻等文科背景)。
4. **工作经验**:有 LLM 评估、搜索评测、大模型数据标注/质检工作经验者优先。