Un LLM es, simplificando mucho, una función estadística gigante que ha leído internet entero y aprende a predecir la siguiente palabra en cualquier frase. Con suficiente escala y entrenamiento, eso se traduce en la ilusión de entender y razonar, aunque por dentro sigue siendo predicción probabilística.

Ejemplos concretos

  • GPT-4 y GPT-5 (OpenAI) detrás de ChatGPT
  • Claude (Anthropic), con variantes Opus, Sonnet y Haiku
  • Gemini (Google), sucesor de Bard
  • LLaMA y Mistral, de código abierto
  • Qwen y DeepSeek, modelos chinos abiertos potentes

¿De dónde saca la información?

Dos caminos:

  1. Datos de entrenamiento. Lo que el modelo "sabe" de memoria porque lo leyó durante su entrenamiento. Este conocimiento tiene una fecha de corte (por ejemplo, Claude 4.6 tiene corte en mayo 2025) y no se actualiza solo.
  2. Navegación en tiempo real. Cuando el LLM tiene permiso de buscar (Perplexity, ChatGPT Search, Claude con web tool), consulta fuentes y cita URL. Aquí es donde tu web puede aparecer aunque el modelo no te conociera antes.

Por qué importa para tu negocio

Si tu contenido está en los datos de entrenamiento de un LLM, el modelo puede recomendarte de memoria. Si no, dependes de que un LLM con navegación te encuentre en el momento de la consulta. En ambos casos, el trabajo técnico es parecido: contenido bien estructurado, con datos verificables y schema correcto. Eso es GEO.

Limitaciones reales

  • Alucinan: inventan datos cuando no saben (más sobre esto en alucinación)
  • No tienen información en tiempo real sin navegación
  • Cada uno tiene sesgos distintos según cómo se entrenaron
  • Pueden cambiar de criterio entre versiones: lo que un modelo recomienda hoy puede no recomendarlo mañana

Por eso la estrategia GEO no es "hackear un LLM concreto" sino construir señales de autoridad tan claras que cualquier LLM razonable termine citándote.

¿Quieres saber si algún LLM menciona ya tu negocio? Auditamos tu presencia en 4-5 LLMs en la auditoría gratis.