Skip to content

We-R22/JD-training

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 

Repository files navigation

JD-training

Con base en el robot bípedo JD, cuyas características cinemáticas son mostradas en la siguiente figura, ha sido implementado un problema de Aprendizaje Por Refuerzo Profundo para el aprendizaje de la marcha bípeda.

jd_training

El robot fue entrenado en el entorno de simulación multi-cuerpo Pybullet, utilizando el algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3), con un total de 300 000 epiodios de entrenamiento, el el siguente video se aprecian seis diferentes episodios de entrenamiento:

training_video.mp4

La curva de entrenamiento su muestra a continuación:

jd_training_2

Después de 8 horas de entrenamiento en una computadora Nvidia Jetson Nano, el algoritmo de aprendizaje TD3 fue capaz de aprender a desplazarse en el entorno virtual, como se observa en el siguiente video:

trained_jd.mp4

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published