职位详情
博士(AI方向)
面议
阿里巴巴达摩院(杭州)科技有限公司
杭州
1-3年
硕士
12-12
工作地址

杭州

职位描述
职位描述:
1. 参与多模态AI相关的技术和研发。从数据侧(data-centric),模型侧(model-centric),以及类人偏好侧(human-centric)等方面,开展相应的研究工作。包括并不局限于多模态数据融合对齐,数据高效学习(半监督、自监督),模型推理决策(planning, action),提示词优化(如思维链, 上下文学习)。结合多模态大模型的发展趋势,打造多模态通用的AI能力,形成有影响力的研究工作,包括论文和专利。
2. 深入多模态在计算机视觉中的应用场景,包括内容理解(检测、分割、分类)与生成(图像,视频生成,编辑等)相关的已有场景,以及机器人具身智能(如自主性决策、推理、控制,环境交互等),虚拟智能体助手(Agent)等新兴场景。提升相关技术和系统,在内外部业务场景进行验证,形成业内领先的技术服务能力和体系。
3. 从业务和系统角度,解决多模态大模型在视觉场景使用中的实际应用问题,如幻觉的克服,高效的参数微调,自我反思,主动在线学习等相关问题。

任职要求:
1. 人工智能、计算机、数学等相关专业硕士以上学历,3年以上计算机视觉,计算机图形学, 机器学习等相关领域的工作经验。
2. 熟悉TensorFlow、PyTorch等深度学习框架,熟悉Vision Transformer, CLIP,Llava,以及BLIP等多模态大模型的原理和实现,具有图文大模型VLM和大语言模型LLM相关的工作经验。
3. 关注多模态AI前沿技术进展,自驱力强,有良好的抗压和团队协作能力。
有以下经验者优先:
1. 在大模型领域(不限于语言、视觉、音频等)有重度参与该领域有重要影响力的项目者优先。
2. 有ACM/NOI/IOI、Kaggle、国内外数学大赛、机器学习、深度学习相关竞赛获奖者优先。
3. 在CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR、TPAMI等国际顶级会议、期刊上,有优异的发表记录。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请