职位描述
岗位职责:
1. 负责对海量文本数据进行建模分析 ,包括但不限于文本语义匹配 ,文本分类等等;
2. 多模数据理解:对于文本/语言/图片/视频等原始语料进行结构化分析、理解 ,为大模型训练及业务场景提供数据基础;
3. 数据策略调优:利用 Learning To Rank 等方法 ,搭建基础数据策路体系 ,以支撑业务场景。
任职要求
1. 5年相关经验 ,计算机 , 电子或数学等相关专业本科及以上学历;
2. 精通各种自然语言处理技术 ,如文本分析、信息提取、 问答系统、知识图谱等。精通各种NLP模型 和算法 ,包括Bert、xi net、CNN. RNN、 DNN、LSTM、Transformer等
3. 对图像的数据处理有一定的了解 ,能够迅速对文本和图像进行一定的数据统计分析 ,能够利用已有模型 ,如 CLIP、 NSFW 进行数据清洗;
4. 具有数据预处理、清洗、转换和标准化的技能 ,能够保证模型训练数据的质量和精确性。
5. 具备出色的沟通技巧 ,能独立对接项目 ,拥有优秀的问题解决能力 、逻辑思维能力和学习能力 ,具 有强烈的职业操守和抗压能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕