职位描述
主要职责:
1. 参与盘古视觉大模型的前沿研究和应用,包括:
开集和闭集分割,检测
多模态对齐
多模态对话(MLLM)
Diffusion图像和视频生成
3d重建和生成
2. 推动研究成果在工业、遥感、智慧城市等领域的项目落地。
职位要求:
计算机、电子信息、软件相关专业,本科及以上学历
熟练掌握Python,pytorch等深度学习常用工具
熟悉Transformer、mamba,CNN等常见架构
了解视觉理解,多模态对齐、对话、diffusion,3d GS等前沿技术
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕