职位描述
岗位职责
1、负责语音/多模态/NLP/CV等领域模型研究,以及下游任务的训练、开发及优化;
2、利用Diffusion类AIGC技术进行智能创作,如视频生成、音乐生成,应用于AI玩法创新;
3、负责llm/mllm的建设和落地,不限于SFT、Prompt、RAG、Tools等,应用于Agent落地;
4、负责音视频智能标签识别能力建设,搭建结构化标签体系,包括类目/属性/质量/关键词等;
任职要求:
1、对CV、多模态、AIGC等相关领域有深入的理解,且有相关实际项目经验;
2、熟悉python/Pytorch等,计算机相关专业;
3、熟悉Diffusion+ControlNet类技术;熟悉llm+Agent,并有落地者优先;有语音算法经验者优先,如tts、asr、音频分类、歌曲生成等;
4、有责任心,乐于沟通,优秀的业务sense;有强烈的上进心,善于学习新事物;
5、有良好的数据敏感性,解决问题的优秀能力;
6、发过高水平会议和期刊,或有竞赛经验者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕