Conceptos y metodología
¿Entrenar de cero o a partir de una política anterior?Entrenar a partir de una política anterior (weights-only)Interpretar métricas de entrenamientoApuntes Varios
Datos accesibles desde self.robot.dataLast updated