382 lecturas

El techo de alineación: desajuste objetivo en el aprendizaje por refuerzo a partir de la retroalimentación humana

by
2024/01/16
featured image - El techo de alineación: desajuste objetivo en el aprendizaje por refuerzo a partir de la retroalimentación humana