1. 专注于对ToB-英文教学方向各类型复杂文本数据按照训练需求进行标注、分析和验证调优,为 LLM 训练打造高质量训练数据集。
2. 依据B端场景的特点和要求,参与制定并持续优化数据标注的标准与流程,保障标注的准确性与一致性。
3. 严格对候选训练数据进行质量把控和质检,及时发现并更正候选数据中的偏差与错误。
4. 与算法团队、产品团队等密切协作,深度理解项目在对应业务方向的需求以及模型的特点,积极提供有针对性的标注策略和建议。
5. 协助完成数据的预处理和清洗工作,提升数据在模型场景能力上的可用性与价值。