机器人算法工程师

关于智域基石(ArcheBase)

智域基石(ArcheBase)是具身智能数据基础设施的领航者。我们的使命是为机器人提供理解物理世界的"第一性原理",成为下一代智能机器构建认知的基石。

我们致力于构建具身智能数据操作系统,将人类技能数字化,为具身智能提供高质量数据供给。

当前,具身智能行业面临着严酷的"质量天花板",伟大的算法往往受困于匮乏的数据。现实世界的物理法则、因果逻辑、力觉、触觉等多维信息反馈,无法仅凭互联网上的数据习得。没有根基的智能,如同沙上建塔。

智域基石应运而生,致力于解决算法专家的终极焦虑——泛化能力与通用能力。通过提供符合物理定律、涵盖长尾场景的高质量数据,我们将智能从"实验室的过拟合"中解放出来,推向真实世界的广阔天地。

我们的愿景:重新定义具身智能数据的工业标准,让不同构型的机器人都能在同一套认知体系下进化。

为什么智域基石是你工作和建立职业生涯的理想之地

在智域基石,我们不只是构建技术,我们正在塑造机器人与物理世界交互的未来。作为具身智能数据基础设施的开拓者,我们相信高质量的数据是解锁机器人智能的关键。我们的使命是通过构建连接物理世界与数字世界的桥梁,让机器人能够像人类一样感知、理解和行动。

我们的文化信条

革故鼎新 顺境敢自革,变局快调整,让进化成为本能
智信笃行 以人工智能重构业务,用数据驱动决策,诚信守正不妥协
志存高远 怀改变天下之志,专注筑造具身智能数据底座
躬行尽责 人人全权担责,事事追求最优,精益求精
和衷共济 包容互信合作,坚信团队合力远超个体总和

在这里,你将创造的不凡

作为机器人算法工程师,你将参与建设具身智能数据与模型验证的核心能力体系。你不仅需要理解模型,也需要理解数据;不仅需要关注实验结果,也需要关注实验结果背后的数据分布、处理逻辑与质量问题。

你将与数据、产品、工程等团队紧密协作,把开源社区中快速演进的模型能力,转化为公司内部可落地、可验证、可比较的算法资产。

你的工作不是孤立地"调一个模型",而是推动形成一套围绕具身智能数据的工程化方法:从数据处理流程设计,到开源模型复现验证,再到数据质量回流与管线协同优化,帮助团队不断提升机器人学习真实世界能力的效率与确定性。

你将负责

1. 具身智能数据处理流程建设与优化

  • 数据理解与拆解:理解算法训练与评测目标,参与具身智能数据的结构设计与字段规范梳理,包括轨迹、动作、观测、多模态传感器信息等
  • 数据处理流程开发:参与原始数据到训练数据的处理流程建设,包括清洗、切片、对齐、格式转换、质量过滤、统计分析等关键环节
  • 规范适配:支持内部数据与主流开源数据格式、数据集规范的映射与适配,提升数据可复用性与实验效率
  • 流程优化:持续优化数据处理链路的稳定性、可追踪性与执行效率,降低数据问题对训练结果的干扰

2. 开源模型复现、验证与效果分析

  • 模型复现:复现具身智能、机器人学习相关开源模型与训练流程,包括 imitation learning、behavior cloning、policy learning、VLA 等方向代表性工作
  • 实验搭建:完成训练环境搭建、依赖管理、配置整理、实验复跑与结果记录,确保复现过程可追踪、可比对、可复用
  • 基线验证:基于内部数据或指定任务构建 baseline,验证模型在不同数据条件、任务场景和训练配置下的表现
  • 结果分析:系统分析实验结果,定位模型表现波动的可能原因,包括数据质量、分布偏差、标签问题、预处理策略、训练参数等因素

3. 协助数据管线进行数据验证与质量闭环

  • 数据验收支持:与数据管线、数采、标注、QA 团队协作,制定并落地面向算法可用性的基础数据验证规则与验收标准
  • 问题识别:通过统计分析、抽样检查、可视化分析、训练反馈等方式识别异常问题,如时间戳错位、轨迹异常、多模态不同步、标注缺失、分布失衡等
  • 质量闭环:推动数据问题从发现走向修复,协助建立问题分类、溯源、反馈、复检的闭环机制
  • 效果回流:将模型训练与验证中暴露出的数据问题沉淀为规则与经验,反向支持数据生产标准优化

我们需要这样的你

基本要求

  • 学历背景:本科及以上,计算机、机器人、自动化、人工智能、电子信息、数学等相关专业优先
  • 工作经验:具备算法研发、机器学习、机器人学习或相关方向项目经验;有具身智能、机器人、自动驾驶、多模态数据处理经验者优先
  • 编程能力:熟练使用 Python,具备良好的工程实现能力,熟悉常用机器学习和深度学习开发工具链
  • 深度学习基础:熟悉 PyTorch 等主流框架,理解模型训练、调参、评测、误差分析的基本方法
  • 数据能力:具备较强的数据分析与问题定位能力,能够独立完成数据检查、统计分析与基础验证脚本开发
  • 综合素质:逻辑清晰、执行力强,能够在不确定性较高的环境中快速学习、主动推进并解决问题

核心能力

数据
理解力
能从算法目标出发理解具身智能数据结构、分布与质量问题,识别影响训练效果的关键因素
复现
能力
能够高质量复现开源模型与论文方案,不止跑通,更能定位差异并解释结果
验证
意识
重视实验与数据的可验证性,习惯建立标准、记录过程、沉淀方法
工程化
思维
能将一次性实验转化为可复用流程、可维护工具和可协作机制
问题
解决
面对复杂链路中的模型或数据问题,能够进行系统性拆解并推动闭环
协作
沟通
能够高效连接算法、数据、工程等不同角色,把技术问题转化为可执行方案

如果你还会...

    如果你还具备以下经验,我们会更加欢迎:

  • 方向经验:有具身智能、人形机器人、操作策略学习、模仿学习、强化学习相关经验
  • 开源生态:熟悉 LeRobot、Open-X Embodiment 等开源具身数据或模型生态
  • 复现实战:有开源论文复现、benchmark 搭建、baseline 建设的实战经验
  • 数据问题认知:了解具身智能中常见的数据问题,如多模态同步、动作轨迹清洗、观测对齐、数据分布偏差等
  • 工程环境:具备 Linux、Docker、训练集群、实验管理工具的使用经验
  • 平台建设经验:有数据管线、数据平台、数据质量体系建设相关经历

在这里,你将获得

🔬
前沿技术参与感
直接参与到具身智能最核心的数据生产环节,参与定义行业数据生产标准与最佳实践
📈
专业成长加速度
在快速发展的领域中获得宝贵的经验和技能,拥有清晰的职业发展路径
💰
有竞争力的回报
包括基本工资、绩效奖金和期权激励在内的全面薪酬体系
🏥
全面的福利体系
包括六险一金、福利年假、年度体检、定期团建、节日福利等全面关怀体系
🏠
灵活的工作环境
我们提供多种工作模式选择,支持高效的远程协作

作为一家成立于 2025 年的新兴科技企业,智域基石正处于快速成长阶段。加入我们,你将:

  • 见证历史:参与公司从初创到行业领先的全过程
  • 塑造文化:帮助建立和传承公司的核心价值与文化
  • 创造标准:在尚无成熟标准的领域定义最佳实践
  • 实现价值:在技术突破与商业成功中找到个人价值实现

如何申请

📧 hr@archebase.ai
  1. 最新简历(中英文均可):清晰展示您的工作经历、项目成果和专业技能
  2. 求职信(如有):说明您为什么适合这个职位,以及您对具身智能数据生产的理解与热情
邮件标题格式:机器人算法工程师应聘 - [您的姓名] - [当前公司/职位]

申请注意事项

  1. 我们承诺在收到申请后一周内给予初步回复
  2. 所有申请信息将严格保密
  3. 欢迎来自不同背景的候选人申请,我们重视多元化
我们期待与你一起,为机器人在真实世界的能力边界拓展,贡献关键的数据力量!在智域基石,我们不仅构建技术,更在塑造未来。