当前位置: 首页 > news >正文

奖励函数(双足)

1.通用奖励项:is_terminated,判断机器人是否终止
2.基座惩罚项
惩罚基座z方向的速度,鼓励机器人保持平衡
惩罚基座x,y方向上的角速度,鼓励机器人保持水平
3.关节惩罚项
惩罚关节加速度,鼓励平滑运动
关节位置限制惩罚,针对踝关节
4.动作惩罚
动作变化率惩罚权重为-0.002,鼓励动作平滑
5.速度跟踪奖励
线性速度跟踪和角速度跟踪
6.其他奖励
脚部空中时间奖励
脚部滑动惩罚(提高步态稳定性,保护硬件)
向上奖励(鼓励机器人保持直立姿态)

http://www.hskmm.com/?act=detail&tid=16234

相关文章:

  • 离线部署镜像仓库搭建
  • Temporal和Airflow有什么差别
  • lc1035-不相交的线
  • 自我介绍与未来规划
  • 解构React Server Components:服务端序列化与流式传输的底层逻辑
  • js里面的单引号、双引号及反引号的用法
  • 牛客刷题-Day4
  • Skinned Mesh Renderer与LOD系统蒙皮变形异常全解析
  • K8S (Containerd)初始化安装流程
  • ?模拟赛 赛后总结
  • 日志|动态规划|最长回文子串|最长公共子序列|HTML CSS
  • Java 字段命名避坑: success和isSuccess
  • OTA升级时软件异常复位问题分析
  • Atcoder Educational DP Contest 做题记录
  • 20250924
  • 跨端边云时序数据管理新范式:Apache IoTDB 的 DB+AI 融合之道 - 实践
  • 《Real-Time Rendering》第二章 图形渲染管线
  • 放弃Unity后,我为什么选择了Unigine?
  • PHP 与 Java 的终极对比:2025年,开发者该如何选择? - 详解
  • 题单63——流程控制
  • 银行同业存单的信用等级
  • 软件技术基础第一次作业
  • 2025XDOJ个人题解——写在前面
  • 适合电子纸屏幕的简易象棋打谱程序
  • 0924
  • java_string比较中的细节
  • 扫描线学习笔记
  • go-reids
  • AI完美声音克隆及情绪控制,与真人无异,Lark下载介绍
  • WSL,适用于 Linux 的 Windows 子系统