← Volver al glosario
Aprendizaje por refuerzo
El modelo aprende por prueba y error, recibiendo recompensas por decisiones correctas.
Avanzado refuerzo politicas
Definición completa
El modelo aprende por prueba y error, recibiendo recompensas por decisiones correctas.
Ejemplo en contexto empresarial
Optimizar rutas logísticas o precios dinámicos.