← Volver al glosario
RLHF (Reinforcement Learning from Human Feedback)
Entrenamiento de modelos con retroalimentación humana para mejorar sus respuestas.
Avanzado rlhf feedback_humano
Definición completa
Entrenamiento de modelos con retroalimentación humana para mejorar sus respuestas.
Ejemplo en contexto empresarial
Mejorar la calidad y seguridad de un asistente conversacional.