94,330 lecturas

94,330 lecturas

RL intuitivo: Introducción a Advantage-Actor-Critic (A2C)

por Rudy Gilman2018/01/09

Read on Terminal Reader

Read this story w/o Javascript

ES

Demasiado Largo; Para Leer

Los profesionales del aprendizaje por refuerzo (RL) han producido una serie de excelentes tutoriales. La mayoría, sin embargo, describe la RL en términos de ecuaciones matemáticas y diagramas abstractos. Nos gusta pensar en el campo desde una perspectiva diferente. RL en sí está inspirado en cómo aprenden los animales, entonces, ¿por qué no traducir la maquinaria subyacente de RL de nuevo en los fenómenos naturales que están diseñados para imitar? Los humanos aprenden mejor a través de las historias.

People Mentioned

Mention Thumbnail

Company Mentioned

Mention Thumbnail

featured image - RL intuitivo: Introducción a Advantage-Actor-Critic (A2C)

Los profesionales del aprendizaje por refuerzo (RL) han producido una serie de excelentes tutoriales. La mayoría, sin embargo, describe la RL en términos de ecuaciones matemáticas y diagramas abstractos. Nos gusta pensar en el campo desde una perspectiva diferente. RL en sí está inspirado en cómo aprenden los animales, entonces, ¿por qué no traducir la maquinaria subyacente de RL de nuevo en los fenómenos naturales que están diseñados para imitar? Los humanos aprenden mejor a través de las historias.

Esta es una historia sobre el modelo Actor Advantage Critical (A2C). Los modelos Actor-Critic son una forma popular de modelo Policy Gradient, que en sí mismo es un algoritmo RL estándar. Si entiendes el A2C, entiendes la RL profunda.

Una vez que haya ganado una intuición para el A2C, consulte:

Nuestra implementación de código simple del A2C (para el aprendizaje) o nuestra versión PyTorch de potencia industrial basada en el modelo TensorFlow Baselines de OpenAI
Introducción a RL de Barto & Sutton , el curso canónico de David Silver , la descripción general de Yuxi Li y el repositorio de GitHub de Denny Britz para una inmersión profunda en RL
El increíble curso de fast.ai para una cobertura intuitiva y práctica del aprendizaje profundo en general, implementado en PyTorch
Tutoriales de Arthur Juliani sobre RL , implementados en TensorFlow.

Ilustraciones de @embermarke

HackerNoon Services

L O A D I N G
. . . comments & more!

About Author

Rudy Gilman@rudygilman

Read my stories

ETIQUETAS

#machine-learning #reinforcement-learning #neural-networks #deep-learning #advantage-actor-critic

ESTE ARTÍCULO FUE PRESENTADO EN...

Read on Terminal Reader

Read this story w/o Javascript

Join HackerNoon

Latest technology trends. Customized Experience. Curated Stories. Publish Your Ideas