一、核心职责
- 1. 负责多模态算法模型开发全流程,包括设计、训练调优、性能评估及部署验证
- 2. 复现多模态方向(如视觉-语言跨模态)的先进算法,在指定平台上进行性能优化
- 3. 开展多模态前沿技术研究与实践(如跨模态检索、图文生成、视频理解等方向)
- 4. 构建多模态数据处理框架,实现图像/文本/语音等跨模态数据的联合表征学习
- 5. 探索多模态大模型(如CLIP、Flamingo等)的微调策略与应用场景
二、技术要求
维度 | 具体要求 |
---|---|
算法能力 |
|
工程能力 |
|
框架掌握 |
|
三、附加要求
- 需具备跨语言文献研读能力(英文论文/技术文档)
- 要求有可验证的多模态项目经验(如跨模态检索系统、图文生成系统等)
- 需参与技术文档撰写和项目汇报
- 优先考虑有低参微调(LoRA/Adapter)或多模态RLHF经验者
注:该岗位常与跨语言算法工程师合并招聘,典型薪资范围为20-40K·14薪(3-5年经验),头部企业可达50K+。