具身智能应用开发方向

机器人学习全链路：从仿真到推理

仿真配置 → 奖励设计 → 数据采集 → 训练推理，三个比赛项目独立交付，结果可复核。

主攻具身智能应用开发，覆盖机器人仿真、训练与推理验证链路

主要看两件事：一是项目链路完整，从任务配置、训练调试到推理验证都有实际交付；二是结果可验证——Motrixarena 三等奖、100 条操作数据、推理视频都有链接。

查看项目技术简历 GitHub 联系我

匹配方向：具身智能应用开发方向

三个技术项目分别覆盖强化学习比赛、人形机器人数据链路和复杂地形迁移，均保留代码、截图或演示证据。

About

关于我

曾子扬 · CS 硕士在读 · 预计毕业：2027年6月

一句话核心竞争力

完成过 61M steps 规模训练、机器人比赛交付、LeRobot 数据采集与 SmolVLA 推理演示，能独立推进仿真配置、训练适配与推理验证流程。

我的机器人方向聚焦具身智能应用开发——基于 MotrixLab、Isaac Lab、LeRobot 等框架，跑通仿真配置、数据采集、训练适配到推理验证的项目链路。相比展示概念，我更强调可复核结果：比赛成绩、训练规模、操作数据、推理视频和 GitHub 仓库都留有证据链。

强化学习

PPO / Reward Shaping / 课程学习

机器人数据链路

LeRobot / 数据采集 / 训练推理

工程交付

Python / Git / 调试优化 / 技术文档

Projects

技术项目

按技术相关度和可验证证据排序，优先展示比赛结果、训练链路、数据采集、模型适配和推理演示。

三等奖 · 61M steps · Reward Shaping · 课程学习迁移

Motrixarena 四足机器人强化学习比赛

时间：2025年12月 - 2026年3月

围绕 VBot 机器人在多个赛段中的运动控制任务，完成环境理解、奖励函数重塑、训练调试、跨阶段训练迁移和最终提交。

技术栈: PythonPPOMotrixSimSKRL课程学习奖励重塑MuJoCoGit
我的角色: 单人参赛者
项目结果: 项目最终获得 Motrixarena 三等奖。训练规模约 61M steps，使用 2048 并行环境完成大规模策略训练，并在不同赛段中进行奖励设计、课程学习和权重迁移尝试。

工程细节比赛仓库 MotrixLab 微信文章技术直播

100条操作数据 · ACT/Pi0训练 · SmolVLA推理演示

人形机器人操作数据采集与 VLA 推理验证

时间：2026年4月 - 进行中

围绕人形机器人操作任务，基于 LeRobot 相关工具链完成操作数据采集、数据格式整理、ACT / Pi0 训练链路尝试，并完成 SmolVLA 推理演示视频录制。

技术栈: PythonLeRobot v2.1→3.0PyTorchACTPi0SmolVLA数据采集训练推理
我的角色: 人形机器人操作数据采集与 VLA 推理验证实践者
项目结果: 完成 100 条机器人操作数据采集，整理 LeRobot 数据结构，尝试 ACT / Pi0 训练流程，并完成 SmolVLA 推理演示视频录制。比赛结果待公布。

工程细节比赛仓库机械臂演示 SmolVLA 推理演示

复杂地形迁移 · HeightScan · 收敛分析

复杂地形迁移 · HeightScan接入 · PPO训练收敛分析

时间：2026年3月 - 2026年4月

基于 Isaac Lab / ANYmal-C 相关环境，进行从平地任务到复杂地形任务的迁移实验，重点关注 HeightScan 高度感知观测接入、PPO 训练稳定性和复杂地形下的策略收敛问题。

技术栈: PythonIsaac LabMotrixLabPPOHeightScanANYmal-C强化学习地形迁移
我的角色: 复杂地形迁移与 PPO 收敛分析实践者
项目结果: 完成 ANYmal-C 从平地任务到复杂地形任务的迁移实验，接入 HeightScan 高度感知观测并进入训练验证流程；定位到 PPO 自适应学习率震荡是训练不稳定的重要来源，后续优化方向集中在学习率调度、奖励尺度对齐和地形观测归一化。

工程细节项目仓库演示截图

Awards

比赛与成果

这些是我参加过的比赛和阶段性成果，我尽量保留可核验链接，方便你看到我的角色、交付内容和结果。

参赛实践 · 进行中 · 2026

优必选全球人形机器人挑战赛 2026

角色: 单人参赛实践
岗位相关性: 人形机器人 / 具身智能

我已经完成官方 baseline 复现、四类任务适配、100 条操作数据采集、ACT/Pi0 训练与 SmolVLA 推理演示，比赛结果待公布。

查看相关链接

三等奖 · 2026

Motrixarena 比赛三等奖

角色: 单人参赛
岗位相关性: AI 机器人 / 具身智能

我独立完成方案设计、奖励函数重塑、训练调试和最终提交，最终获得三等奖。这个项目能说明我从任务理解到工程交付的完整实践能力。

查看相关链接

Skills

技术能力

我没有单独堆技能关键词，而是把每组能力都对应到实际项目、比赛结果或内容数据。

机器人训练与强化学习

我在 Motrixarena 中完成 4 赛段课程学习、61M steps 训练、奖励重塑和跨赛段权重迁移。

PPOReward ShapingActor-Critic课程学习大规模并行训练配置跨阶段训练迁移

机器人数据与模型链路

我在 LeRobot / 优必选挑战赛中完成数据采集、ACT/Pi0 训练、推理演示和仿真迁移。

LeRobotPyTorch数据采集与格式整理ACT/Pi0训练SmolVLA推理仿真迁移验证

AI 应用与工程交付

我在比赛项目中负责方案设计、代码实现、调试优化、项目文档和技术直播沉淀。

实验记录GitHub整理项目复盘视频演示技术文档部署展示

Resume

简历

我为当前方向准备了 AI机器人 / 应用开发方向简历，里面会优先保留与该岗位相关的项目、技能关键词和可验证结果。

技术岗

AI机器人 / 应用开发方向

主攻具身智能应用开发，覆盖机器人仿真、训练与推理验证链路

优先保留项目、技能关键词和可验证结果。

下载简历

Contact

联系方式

如果我的经历和岗位方向匹配，欢迎通过邮箱或 GitHub 联系我。

邮箱zengziyangzzy@163.com GitHubgithub.com/Logic-TARS 位置Shanghai