Prompt engineering en serio
Por empezarTécnicas que separan usuarios medios de avanzados.
1.1
Chain-of-thought: razonamiento estructurado
La técnica que reduce errores en problemas complejos.
Chain-of-thought (CoT) consiste en pedir al modelo que razone paso a paso ANTES de responder. Mejora resultados en problemas con múltiples decisiones intermedias.
Cómo se aplica
- Añade frases como "piensa esto paso a paso" o "lista 3 hipótesis antes de elegir una".
- Para problemas técnicos, fuerza el modelo a explicar cada paso antes de dar la respuesta final.
- Combina con few-shot: muestra un ejemplo de razonamiento.
Para un bug raro: «Tengo este bug. Antes de proponer fix: 1) lista 3 hipótesis, 2) descarta cada una con criterio, 3) solo entonces sugiere solución». La calidad sube enormemente vs respuesta directa.
Antes de responder, piensa paso a paso:
1) ¿Qué pregunta se hace exactamente?
2) ¿Qué información necesito?
3) Lista 2-3 enfoques posibles
4) Evalúa cada uno
5) Da la respuesta justificada
Problema: {{problema}}
Coge un problema complejo (decisión de negocio, bug, análisis). Resuélvelo dos veces: respuesta directa vs CoT. Compara.
Decisiones más sólidas. Menos respuestas superficiales.
- Usar CoT para todo: para tareas triviales solo gasta tokens.
- No pedir explícitamente el razonamiento: el modelo a veces lo salta.
1.2
Role prompting y plantillas reutilizables
Asigna identidad y experiencia al modelo. La respuesta cambia radicalmente.
Decirle al modelo "eres consultor SEO con 10 años de experiencia" altera el frame de la respuesta. No es magia: los patrones de entrenamiento asociados a ese rol se activan más.
Roles eficaces
- Editorial: "editor de revista tecnológica que detesta clichés".
- Técnico: "ingeniero senior con experiencia en producción".
- Comercial: "responsable de cuenta con cliente molesto".
- Crítico: "revisor escéptico que cuestiona cada afirmación".
Mismo problema, dos roles: «Como freelance, ¿debo subir precio?» vs «Como consultor de pricing con 15 años, ¿debo subir precio?». Segundo prompt: análisis estructurado con criterios.
Actúa como {{rol específico con años de experiencia}}.
Tarea: {{qué quieres}}
Contexto: {{información relevante}}
Formato: {{cómo}}
No hagas: {{restricciones}}
Toma 3 tareas habituales tuyas. Define el "rol experto" ideal para cada una. Aplícalo durante una semana.
Resultados con sesgo profesional, no genéricos.
- Roles vagos: "experto" no funciona; especificar siempre.
- Olvidar el rol en respuestas largas: el modelo lo pierde tras 5-6 turnos.
1.3
Few-shot eficaz: cómo elegir los ejemplos
No cualquier ejemplo vale. Hay reglas para que funcione.
Few-shot eficaz: 3 ejemplos bien elegidos > 10 ejemplos aleatorios. Reglas:
- Ejemplos representativos del caso real, no del caso fácil.
- Incluye al menos un caso límite (input raro, output inesperado).
- Mismo formato exacto entre los ejemplos y el output deseado.
- Si pides JSON, todos los ejemplos en JSON estricto.
Clasificas emails como "comercial / soporte / spam". Ejemplos: 1 claro de cada categoría + 1 caso ambiguo donde explicas el criterio. Modelo aprende mejor con 4 ejemplos que con 20 ejemplos triviales.
Aprende el patrón:
Input: {{ej1_input}} → Output: {{ej1_output}}
Input: {{ej2_input}} → Output: {{ej2_output}}
Input: {{caso_limite}} → Output: {{caso_limite_output}} (nota: este es ambiguo, criterio = {{regla}})
Ahora clasifica:
Input: {{tu_input}}
En tu tarea repetitiva, define 3-4 ejemplos óptimos. Mide consistencia con/sin ellos.
Tareas repetitivas con consistencia de output.
- Ejemplos triviales: no enseñan al modelo nada nuevo.
- Olvidar el caso límite: el modelo falla en producción real.
1.4
Cómo evitar alucinaciones desde el prompt
Reduce alucinaciones un 70% solo con cambios en cómo preguntas.
Trucos validados que reducen alucinaciones:
- "Si no sabes, di no lo sé": instrúyelo explícitamente.
- Pide grados de certeza: "marca cada afirmación como [seguro], [probable] o [verificar]".
- Fuerza citas: si afirma algo concreto, debe poder citar fuente.
- Cierra el contexto: dale el material y pide que se base SOLO en él.
Mal: «¿Qué dijo X sobre Y?». Bien: «Basándote SOLO en los textos que te he pegado, ¿qué dice X sobre Y? Si no aparece, di "no aparece" — no inventes basándote en conocimiento general».
Responde basándote SOLO en este material. Si la respuesta no está aquí, di "no aparece" — no completes con conocimiento general.
Material:
"""
{{material}}
"""
Pregunta: {{pregunta}}
En 3 tareas con datos reales tuyos, fuerza contexto cerrado. Mide cuántas alucinaciones se reducen.
Datos fiables en tareas críticas.
- No verificar aunque el prompt sea anti-alucinación: sigue siendo necesario.
- Cerrar contexto en preguntas que requieren conocimiento general: bloqueas respuestas útiles.