RAG combina la capacidad del LLM de entender lenguaje natural con la fiabilidad de una fuente externa verificable. Técnicamente es como darle a un abogado un chatbot conectado con la ley actualizada: no memoriza todos los BOEs, solo sabe buscar y citar.

Cómo funciona, muy simplificado

  1. El usuario hace una pregunta
  2. El sistema convierte la pregunta en un vector (embedding) y busca documentos similares
  3. Los documentos recuperados se incluyen en el prompt del LLM como contexto
  4. El LLM genera una respuesta basada en esos documentos y cita las fuentes

RAG en motores públicos

  • Perplexity: RAG puro, busca en web cada consulta y cita
  • ChatGPT Search: RAG sobre índice web cuando el modelo decide que lo necesita
  • Google AI Overviews: RAG sobre el propio índice de Google
  • Claude con web tool: RAG bajo demanda del usuario

Por qué RAG cambia el SEO/GEO

Antes de RAG, un LLM solo podía recomendarte si te había memorizado. Con RAG, cualquier página indexada puede ser citada aunque el modelo no la conociera antes. Eso democratiza: sitios nuevos pueden competir si están bien estructurados.

Qué ayuda a ser recuperado por RAG

  1. Títulos y H2 claros con la keyword/pregunta
  2. Fragmentos autocontenidos (RAG suele cortar la web en fragmentos de ~500 palabras)
  3. Schema rico
  4. AEO summary extraíble al inicio
  5. Datos específicos y fechados

¿Quieres saber si tu contenido está siendo recuperado por RAG de Perplexity, ChatGPT Search o AI Overviews? Se analiza en la auditoría gratis.