国家地方共建具身智能机器人创新中心(曾用名:北京人形机器人创新中心、北京具身智能机器人创新中心,以下简称“国创中心”)于2023年11月在北京经济技术开发区成立,是国内首家聚焦于具身智能机器人核心技术、产品研发、应用生态建设的创新中心。国创中心由优必选、京城机电、小米机器人、亦庄机器人等机器人行业领军企事业单位联合组建,汇聚了全球具身智能机器人产业顶尖的科学家和工程师,研发人员占比70%以上。
国创中心聚焦具身智能机器人关键共性技术研发和生态建设,围绕通用机器人母平台“天工”和多能具身智能体平台“开物”两大核心任务开展攻坚,并致力于成为具身智能领域的行业资源组织者、产业发展培育者、落地应用推动者,打造具有全球影响力的具身智能创新策源地和应用示范高地。
2025年4月19日,天工Ultra机器人全程用时约2小时40分冲过2025北京亦庄人形机器人半程马拉松的终点线。
团队介绍
我们是一支专注于具身智能与多模态大模型融合的前沿研究团队,致力于构建下一代能够理解、感知并与物理世界交互的智能体。
代博士,博士毕业电子科技大学,原腾讯AI Lab研究员、同花顺高级算法专家,现为国地共建具身智能机器人创新中心大模型负责人。在人工智能领域深耕多年,拥有丰富的业界和研究经验,已发表三十多篇人工智能顶会论文。
招聘岗位:实习生(国地共建具身智能机器人创新中心(北京亦庄))
研究方向
多模态算法实习生(理解方向)
工作条件
• 与顶尖研究员合作的机会,参与前沿AI项目;
• 充足的计算资源(A100/H100集群),支持大规模实验;
• 开放的学术氛围,鼓励发表顶会论文与开源贡献;
岗位职责
• 负责多模态大模型的后训练工作,包括数据构造、模型微调、对齐优化等;
• 深入理解并应用视觉-语言模型(如CLIP、BLIP、Flamingo、LLaVA等),提升模型在具身场景下的表现;
• 构建高质量的多模态训练数据(图文对齐、视频-文本、动作-指令等),设计数据清洗与增强策略;
• 与机器人、仿真平台团队协作,推动模型在真实或仿真环境中的部署与验证;
• 跟踪多模态、具身智能、视觉推理等前沿研究,持续优化模型结构与训练策略。
岗位要求
• 计算机科学、人工智能、机器学习等相关专业硕士及以上学历;
• 熟悉Transformer架构,有多模态模型训练经验(如VL模型、跨模态对齐、指令微调等);
• 熟练使用PyTorch / DeepSpeed / HuggingFace等训练框架,具备大规模模型训练与调优能力;
• 熟悉视觉模型(如ViT、Swin、ResNet)及其与语言模型的融合机制;
• 有数据构造经验,熟悉多模态数据清洗、配比、指令生成等流程;
• 具备优秀的代码能力和团队协作精神,有顶会论文(CVPR/ICCV/NeurIPS/ICLR/EMNLP等)或开源项目贡献者优先;
• 有具身智能、机器人感知、仿真平台(如Habitat、Isaac Sim、Gazebo)经验者加分。
加分项:
• 熟悉RLHF、DPO、LoRA、QLoRA等对齐与微调技术;
• 有视频理解、动作预测、3D视觉等相关项目经验;
• 参与过多模态大模型开源项目(如LLaVA、MiniGPT-4、InstructBLIP等);
• 有跨模态检索、视觉问答(VQA)、视觉推理等任务经验。
联系方式:
请发送简历至 vito.dai@x-humanoid.com,邮件主题格式:多模态理解算法实习生 - [姓名]

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢