Qué es la IA (sin tecnicismos)
Por empezarLa base mental para no perderte en hype ni jerga. Modelos, tokens, contexto y por qué la IA alucina.
1.1
Qué es un LLM y cómo predice palabras
Entiende lo que hay dentro de ChatGPT/Claude sin matemáticas. Por qué "no piensa" pero responde tan bien.
Un LLM (Large Language Model) es un modelo entrenado para predecir la siguiente palabra (o "token") más probable dada una secuencia anterior. Cuando escribes en ChatGPT, el modelo no está "razonando" en sentido humano: está calculando qué palabra encaja mejor a continuación, una tras otra, hasta completar la respuesta.
Esta es la mecánica básica. Lo interesante es que, con cantidades masivas de datos de entrenamiento (libros, web, código), esa predicción palabra-a-palabra reproduce patrones de razonamiento, conversación y estructura textual sorprendentemente bien.
Implicaciones que sí importan para ti
- El modelo no "sabe" cosas con certeza: completa con lo más plausible. Por eso a veces inventa.
- Cuanto mejor sea el prompt, mejor predice. Por eso un prompt vago da respuestas vagas.
- El contexto que le des marca enormemente el resultado.
Si escribes solo "ayúdame con un email", el modelo no tiene contexto y responderá con un email genérico. Si dices "ayúdame con un email para mi jefe pidiendo retrasar la entrega del informe trimestral por una semana, tono profesional pero cercano", el modelo tiene mucho más con lo que predecir y la respuesta es directamente utilizable.
Explica con tus propias palabras cómo un LLM genera una respuesta. Usa una analogía cotidiana (cocina, conducción, deporte) y NO uses la palabra "predicción".
Abre ChatGPT y haz la misma pregunta dos veces: una con 5 palabras y otra con un párrafo de contexto. Anota la diferencia de calidad. Esa diferencia es el 80 % del curso.
Quedarás con una intuición clara de por qué el contexto importa tanto. Esta lección desbloquea todas las siguientes.
- Esperar que un LLM tenga "opinión propia" o "intención". No la tiene.
- Asumir que si suena seguro, es verdad. Los LLMs alucinan con tono firme.
1.2
Tokens, ventana de contexto y por qué importan
Cuántas palabras "ve" el modelo a la vez y por qué tu PDF de 200 páginas no entra en el chat.
Un token es la unidad mínima de texto que procesa un LLM. No equivale exactamente a una palabra: "ChatGPT" puede ser un token, mientras que "preocupación" se divide en varios. En español, una palabra promedio son 1,3-1,8 tokens.
La ventana de contexto es cuántos tokens el modelo puede tener en cuenta a la vez: lo que escribiste + lo que ha generado + cualquier archivo adjunto. Cada modelo tiene un límite:
- GPT-4o: 128.000 tokens (~96.000 palabras)
- Claude Sonnet 4: 200.000 tokens (~150.000 palabras)
- Gemini 1.5 Pro: 1.000.000 tokens (~750.000 palabras)
Cuando subes un documento largo, el modelo lo "tokeniza" y lo guarda en su ventana. Si el documento excede el límite, partes se descartan.
Quieres resumir un libro de 400 páginas. En ChatGPT con plan free (8k tokens) no entra ni un capítulo entero. En Claude Pro (200k tokens) entra el libro completo. Esta es una diferencia real que decide qué modelo usar para qué tarea.
Resume este documento. Para cada punto clave, incluye una cita literal (entre comillas) del texto original. Si una sección queda fuera de tu contexto, dilo explícitamente.
Toma un texto de 1.000 palabras. Cuéntalas y luego pásalo por el tokenizer de OpenAI. Calcula la ratio palabras/tokens en tu idioma habitual.
Saber estimar a ojo si un documento "entra" o no en un chat de IA y elegir la herramienta adecuada.
- Pegar PDFs gigantes al chat free y asumir que los procesa enteros. No los procesa.
- No leer el límite de tu plan: ChatGPT free recorta contexto y pierdes parte del contexto entre mensajes.
1.3
Alucinaciones: por qué la IA inventa y cómo detectarlas
El error más peligroso y el más fácil de evitar si lo entiendes.
Una alucinación es cuando un LLM produce información incorrecta con la misma confianza que la correcta. No es un bug: es el resultado natural de cómo predice palabras. Si en el corpus de entrenamiento hay patrones que "encajan", aunque no se basen en hechos verificables, el modelo los reproduce.
Tipos típicos
- Citas inventadas: el modelo "recuerda" un libro o paper que no existe.
- Cifras plausibles pero falsas: porcentajes, fechas, precios que suenan razonables pero no son verificables.
- Funciones de software inventadas: en código, llamadas a métodos que no existen en la librería.
Cómo reducirlas en el prompt
- Pide explícitamente: "si no tienes esta información, dilo, no inventes".
- Pide que cite fuentes con enlace o capítulo.
- Para datos importantes, verifica con búsqueda externa antes de usar la respuesta.
Pregunta: "¿Quién ganó el Goya a mejor película en 2027?". Si no estamos en 2027 todavía, el modelo no debería tener esa información. Si responde un nombre sin avisar, está alucinando. La forma correcta: "no dispongo de información posterior a mi fecha de corte".
Responde solo con información que puedas justificar. Si no estás seguro de algún dato concreto (fecha, cifra, cita), márcalo entre [verificar] y dime qué buscar para confirmar.
Dame 3 fuentes (con URL o referencia) que confirmen lo que acabas de afirmar. Si no puedes citar fuentes, retira esa afirmación.
Pídele a ChatGPT un dato muy específico de tu sector: una cifra, una fecha, una cita. Después verifica manualmente. Anota qué porcentaje de veces alucina.
Adoptar el hábito de verificar siempre los datos concretos antes de publicarlos o tomar decisiones con ellos.
- Copiar-pegar números sin verificar.
- Asumir que si el modelo cita una fuente, esa fuente existe (a veces inventa el título también).
1.4
12 términos imprescindibles del vocabulario IA
Sin esto, los siguientes módulos confunden. Con esto, hablas el idioma.
Vocabulario mínimo viable. Léelo dos veces:
- Modelo: el cerebro entrenado (GPT-5, Claude Sonnet 4, Gemini Pro).
- Prompt: lo que tú escribes para guiar la respuesta.
- Token: unidad mínima de texto que procesa el modelo.
- Contexto: todo lo que el modelo "ve" en una conversación.
- Ventana de contexto: cuántos tokens caben a la vez.
- Temperatura: cuánta creatividad/aleatoriedad permites (0 = predecible, 1+ = creativo).
- Alucinación: respuesta plausible pero incorrecta.
- Fine-tuning: ajustar un modelo con tus datos.
- RAG (Retrieval-Augmented Generation): conectar el modelo a una base de conocimiento propia.
- API: forma de llamar al modelo desde tu código.
- Embeddings: representación numérica del significado de un texto.
- Agente: sistema que usa un LLM para decidir acciones por sí mismo.
Cuando alguien dice "los agentes con RAG sobre embeddings vectoriales reducen las alucinaciones", ahora puedes traducir: "los sistemas autónomos que consultan tu propia base de datos antes de responder se equivocan menos". Si no entiendes los términos, te pierdes el 80% de las novedades.
Explícame el término [X] como si tuviera 12 años. Después, dame una analogía con un oficio cotidiano. Por último, un ejemplo concreto donde se aplique.
Memoriza los 12 términos. Después, sin mirar, escríbelos con una frase de definición cada uno y dáselos a ChatGPT para que evalúe la precisión.
Poder leer un artículo de IA en 2026 sin sentirte perdido.
- Saltarte vocabulario: te morderá en módulos posteriores.
- Confundir "modelo" con "herramienta": ChatGPT es la herramienta; GPT-5 es el modelo dentro.