岗位职责:
1、负责文本前端模型和语音合成大模型的训练和微调;
2、负责搭建语音数据处理的pipeline;
3、参与语音相关数据的选取、清洗和自动标注工作;
4、优化业务case,提升语音大模型的可控性和稳定性;
5、跟踪和研究语音大模型的前沿技术。
任职要求:
1、计算机科学、信号处理、电子工程或相关专业硕士及以上学历;
2、扎实的机器学习、深度学习理论基础、语音信号理论基础;
3、对语音领域相关大模型进行跟踪和思考;
4、对ASR、TTS、人声检测、说话人分割、人声分离等语音任务有实践经验;
5、具备良好的沟通能力和团队合作精神,能够独立思考和解决问题;
6、对语音技术充满热情,有志于在语音合成领域长期发展。