具身智能应用开发方向

机器人学习全链路:从仿真到推理

仿真配置 → 奖励设计 → 数据采集 → 训练推理,三个比赛项目独立交付,结果可复核。

主攻具身智能应用开发,覆盖机器人仿真、训练与推理验证链路

主要看两件事:一是项目链路完整,从任务配置、训练调试到推理验证都有实际交付;二是结果可验证——Motrixarena 三等奖、100 条操作数据、推理视频都有链接。

机器人实验室机械臂测试场景

匹配方向:具身智能应用开发方向

三个技术项目分别覆盖强化学习比赛、人形机器人数据链路和复杂地形迁移,均保留代码、截图或演示证据。

About

关于我

曾子扬 · CS 硕士在读 · 预计毕业:2027年6月

一句话核心竞争力

完成过 61M steps 规模训练、机器人比赛交付、LeRobot 数据采集与 SmolVLA 推理演示,能独立推进仿真配置、训练适配与推理验证流程。

我的机器人方向聚焦具身智能应用开发——基于 MotrixLab、Isaac Lab、LeRobot 等框架,跑通仿真配置、数据采集、训练适配到推理验证的项目链路。相比展示概念,我更强调可复核结果:比赛成绩、训练规模、操作数据、推理视频和 GitHub 仓库都留有证据链。

强化学习

PPO / Reward Shaping / 课程学习

机器人数据链路

LeRobot / 数据采集 / 训练推理

工程交付

Python / Git / 调试优化 / 技术文档

Projects

技术项目

按技术相关度和可验证证据排序,优先展示比赛结果、训练链路、数据采集、模型适配和推理演示。

三等奖 · 61M steps · Reward Shaping · 课程学习迁移

Motrixarena 四足机器人强化学习比赛

时间:2025年12月 - 2026年3月

围绕 VBot 机器人在多个赛段中的运动控制任务,完成环境理解、奖励函数重塑、训练调试、跨阶段训练迁移和最终提交。

技术栈
PythonPPOMotrixSimSKRL课程学习奖励重塑MuJoCoGit
我的角色
单人参赛者
项目结果
项目最终获得 Motrixarena 三等奖。训练规模约 61M steps,使用 2048 并行环境完成大规模策略训练,并在不同赛段中进行奖励设计、课程学习和权重迁移尝试。
100条操作数据 · ACT/Pi0训练 · SmolVLA推理演示

人形机器人操作数据采集与 VLA 推理验证

时间:2026年4月 - 进行中

围绕人形机器人操作任务,基于 LeRobot 相关工具链完成操作数据采集、数据格式整理、ACT / Pi0 训练链路尝试,并完成 SmolVLA 推理演示视频录制。

技术栈
PythonLeRobot v2.1→3.0PyTorchACTPi0SmolVLA数据采集训练推理
我的角色
人形机器人操作数据采集与 VLA 推理验证实践者
项目结果
完成 100 条机器人操作数据采集,整理 LeRobot 数据结构,尝试 ACT / Pi0 训练流程,并完成 SmolVLA 推理演示视频录制。比赛结果待公布。
复杂地形迁移 · HeightScan · 收敛分析

复杂地形迁移 · HeightScan接入 · PPO训练收敛分析

时间:2026年3月 - 2026年4月

基于 Isaac Lab / ANYmal-C 相关环境,进行从平地任务到复杂地形任务的迁移实验,重点关注 HeightScan 高度感知观测接入、PPO 训练稳定性和复杂地形下的策略收敛问题。

技术栈
PythonIsaac LabMotrixLabPPOHeightScanANYmal-C强化学习地形迁移
我的角色
复杂地形迁移与 PPO 收敛分析实践者
项目结果
完成 ANYmal-C 从平地任务到复杂地形任务的迁移实验,接入 HeightScan 高度感知观测并进入训练验证流程;定位到 PPO 自适应学习率震荡是训练不稳定的重要来源,后续优化方向集中在学习率调度、奖励尺度对齐和地形观测归一化。

Awards

比赛与成果

这些是我参加过的比赛和阶段性成果,我尽量保留可核验链接,方便你看到我的角色、交付内容和结果。

参赛实践 · 进行中 · 2026

优必选全球人形机器人挑战赛 2026

角色
单人参赛实践
岗位相关性
人形机器人 / 具身智能

我已经完成官方 baseline 复现、四类任务适配、100 条操作数据采集、ACT/Pi0 训练与 SmolVLA 推理演示,比赛结果待公布。

查看相关链接

三等奖 · 2026

Motrixarena 比赛三等奖

角色
单人参赛
岗位相关性
AI 机器人 / 具身智能

我独立完成方案设计、奖励函数重塑、训练调试和最终提交,最终获得三等奖。这个项目能说明我从任务理解到工程交付的完整实践能力。

查看相关链接

Skills

技术能力

我没有单独堆技能关键词,而是把每组能力都对应到实际项目、比赛结果或内容数据。

机器人训练与强化学习

我在 Motrixarena 中完成 4 赛段课程学习、61M steps 训练、奖励重塑和跨赛段权重迁移。

PPOReward ShapingActor-Critic课程学习大规模并行训练配置跨阶段训练迁移

机器人数据与模型链路

我在 LeRobot / 优必选挑战赛中完成数据采集、ACT/Pi0 训练、推理演示和仿真迁移。

LeRobotPyTorch数据采集与格式整理ACT/Pi0训练SmolVLA推理仿真迁移验证

AI 应用与工程交付

我在比赛项目中负责方案设计、代码实现、调试优化、项目文档和技术直播沉淀。

实验记录GitHub整理项目复盘视频演示技术文档部署展示

Resume

简历

我为当前方向准备了 AI机器人 / 应用开发方向 简历,里面会优先保留与该岗位相关的项目、技能关键词和可验证结果。

技术岗

AI机器人 / 应用开发方向

主攻具身智能应用开发,覆盖机器人仿真、训练与推理验证链路

优先保留项目、技能关键词和可验证结果。

下载简历

Contact

联系方式

如果我的经历和岗位方向匹配,欢迎通过邮箱或 GitHub 联系我。