Evaluación de Calidad (LLM-as-a-Judge)
La IA evalúa a la IA
¿Cómo sabes si un texto generado es bueno? Usando otra IA como juez. Este patrón se usa en ingeniería para automatizar el control de calidad.
Rúbrica automática
Este prompt evalúa objetivamente la calidad de una respuesta basándose en criterios fijos.
PROMPT INTERACTIVO
Actúa como Juez Evaluador de IA.
He pedido a una IA que escriba un artículo sobre [Tema].
Evalúa su respuesta (Output) basándote en estos 3 criterios y dale una puntuación del 1 al 5.
Criterios:
1. Veracidad: ¿Hay alucinaciones o datos vagos?
2. Estilo: ¿Es el tono adecuado o suena robótico?
3. Completitud: ¿Responde a todo lo que se pidió?
Output de la IA: ‘[Pegar Texto]’
Genera el informe de evaluación en formato JSON.
