强化学习
PPO / Reward Shaping / 课程学习
具身智能应用开发方向
仿真配置 → 奖励设计 → 数据采集 → 训练推理,三个比赛项目独立交付,结果可复核。
主攻具身智能应用开发,覆盖机器人仿真、训练与推理验证链路
主要看两件事:一是项目链路完整,从任务配置、训练调试到推理验证都有实际交付;二是结果可验证——Motrixarena 三等奖、100 条操作数据、推理视频都有链接。

匹配方向:具身智能应用开发方向
三个技术项目分别覆盖强化学习比赛、人形机器人数据链路和复杂地形迁移,均保留代码、截图或演示证据。
About
曾子扬 · CS 硕士在读 · 预计毕业:2027年6月
一句话核心竞争力
完成过 61M steps 规模训练、机器人比赛交付、LeRobot 数据采集与 SmolVLA 推理演示,能独立推进仿真配置、训练适配与推理验证流程。
我的机器人方向聚焦具身智能应用开发——基于 MotrixLab、Isaac Lab、LeRobot 等框架,跑通仿真配置、数据采集、训练适配到推理验证的项目链路。相比展示概念,我更强调可复核结果:比赛成绩、训练规模、操作数据、推理视频和 GitHub 仓库都留有证据链。
PPO / Reward Shaping / 课程学习
LeRobot / 数据采集 / 训练推理
Python / Git / 调试优化 / 技术文档
Projects
按技术相关度和可验证证据排序,优先展示比赛结果、训练链路、数据采集、模型适配和推理演示。
时间:2025年12月 - 2026年3月
围绕 VBot 机器人在多个赛段中的运动控制任务,完成环境理解、奖励函数重塑、训练调试、跨阶段训练迁移和最终提交。
时间:2026年4月 - 进行中
围绕人形机器人操作任务,基于 LeRobot 相关工具链完成操作数据采集、数据格式整理、ACT / Pi0 训练链路尝试,并完成 SmolVLA 推理演示视频录制。
时间:2026年3月 - 2026年4月
基于 Isaac Lab / ANYmal-C 相关环境,进行从平地任务到复杂地形任务的迁移实验,重点关注 HeightScan 高度感知观测接入、PPO 训练稳定性和复杂地形下的策略收敛问题。
Awards
这些是我参加过的比赛和阶段性成果,我尽量保留可核验链接,方便你看到我的角色、交付内容和结果。
Skills
我没有单独堆技能关键词,而是把每组能力都对应到实际项目、比赛结果或内容数据。
我在 Motrixarena 中完成 4 赛段课程学习、61M steps 训练、奖励重塑和跨赛段权重迁移。
我在 LeRobot / 优必选挑战赛中完成数据采集、ACT/Pi0 训练、推理演示和仿真迁移。
我在比赛项目中负责方案设计、代码实现、调试优化、项目文档和技术直播沉淀。
Resume
我为当前方向准备了 AI机器人 / 应用开发方向 简历,里面会优先保留与该岗位相关的项目、技能关键词和可验证结果。
技术岗
主攻具身智能应用开发,覆盖机器人仿真、训练与推理验证链路
优先保留项目、技能关键词和可验证结果。
Contact
如果我的经历和岗位方向匹配,欢迎通过邮箱或 GitHub 联系我。