Aprendizaje por Refuerzo

Una técnica de aprendizaje de robots para desarrollar robots autónomos, adaptables y eficientes.

Nissan

Image Credit: Agility, Apptronik, Fourier, Unitree

Cargas de Trabajo

Robótica

Industrias

Industrias

Todas las Industrias

Objetivo Comercial

Innovación

Productos

NVIDIA AI Enterprise
NVIDIA Isaac GR00T
NVIDIA Isaac Lab
NVIDIA Isaac Sim
NVIDIA Omniverse

Capacitación para Robots Físicos con Habilidades Complejas con el Aprendizaje por Refuerzo

A medida que los robots realizan tareas cada vez más complejas, la programación tradicional no resulta suficiente. El aprendizaje por refuerzo (RL) cierra esta brecha al permitir que los robots entrenen en simulación a través de prueba y error para mejorar las habilidades de control, planificación de rutas y manipulación. Este aprendizaje basado en recompensas fomenta la adaptación continua, lo que permite a los robots desarrollar habilidades motoras sofisticadas para tareas de automatización del mundo real, como el agarre, la locomoción y la manipulación compleja. 

Entrenamiento de RL Acelerado por GPU para Robótica

El entrenamiento tradicional basado en CPU para RL de robots a menudo requiere miles de núcleos para tareas complejas, lo que aumenta los costos de las aplicaciones de robots. La computación acelerada de NVIDIA aborda este desafío con capacidades de procesamiento en paralelo que aceleran mucho el procesamiento de datos sensoriales en entornos de aprendizaje por refuerzo habilitados por percepción. Esto mejora las capacidades de los robots para aprender, adaptarse y realizar tareas complejas en situaciones dinámicas.

Las plataformas de computación acelerada de NVIDIA; incluidas los frameworks de entrenamiento de robots, como NVIDIA Isaac™ Lab; aprovechan la potencia de la GPU para simulaciones físicas y cálculos de recompensas dentro del pipeline de RL. Esto elimina cuellos de botella y agiliza el proceso, lo que facilita una transición más fluida de la simulación a la implementación en el mundo real.

Isaac Lab para Aprendizaje por Refuerzo

Isaac Lab es un framework modular basado en NVIDIA Isaac Sim™ que simplifica los workflows de entrenamiento de robots, como el aprendizaje de refuerzo e imitación. Los desarrolladores pueden aprovechar las capacidades más recientes de Omniverse™ para el entrenamiento de políticas complejas con percepción habilitada.

  • Ensambla la Escena: El primer paso es desarrollar una escena en Isaac Sim o Isaac Lab e importar recursos de robots de URDF o MJCF. Aplica esquemas de física para la simulación e integra sensores para el entrenamiento de políticas basadas en percepción.
  • Define Tareas de RL: Una vez que la escena y el robot estén configurados, el siguiente paso es definir la tarea que se completará y la función de recompensa. El entorno (p. ej., Basado en Administradores o Workflow Directo) proporciona el estado actual del agente, además de observar y ejecutar las acciones que proporciona. Luego, el entorno responde a los agentes proporcionando los próximos estados.
  • Entrena: El último paso es definir los hiperparámetros para el entrenamiento y la arquitectura de políticas. Isaac Lab proporciona cuatro bibliotecas de RL para el entrenamiento de los modelos con GPU: StableBaselines3, RSL-RL, RL-Games y SKRL.
  • Escala: Para escalar el entrenamiento en sistemas de múltiples GPU y múltiples nodos, los desarrolladores pueden usar OSMO para orquestar tareas de entrenamiento de múltiples nodos en una infraestructura distribuida.

NVIDIA Isaac GR00T ofrece a los desarrolladores una nueva forma de desarrollar específicamente robots humanoides. Esta iniciativa de investigación y plataforma de desarrollo para modelos bases de robots de propósito general y pipelines de datos puede ayudar a comprender el lenguaje, emular movimientos humanos y adquirir rápidamente habilidades a través del aprendizaje multimodal.

Para obtener más información y acceder a GR00T, regístrate en el Programa para Desarrolladores de Humanoides de NVIDIA.

Ecosistema de Socios

Vea cómo nuestro ecosistema está desarrollando sus propios servicios y aplicaciones de robótica basados en el aprendizaje por refuerzo y las tecnologías de NVIDIA.

Empiece Ahora

Los investigadores y desarrolladores actuales adoptan ampliamente el aprendizaje por refuerzo para la robótica. Más información sobre NVIDIA Isaac Sim para el aprendizaje de robots en la actualidad.

Noticias