RAG combina la capacidad del LLM de entender lenguaje natural con la fiabilidad de una fuente externa verificable. Técnicamente es como darle a un abogado un chatbot conectado con la ley actualizada: no memoriza todos los BOEs, solo sabe buscar y citar.
Cómo funciona, muy simplificado
- El usuario hace una pregunta
- El sistema convierte la pregunta en un vector (embedding) y busca documentos similares
- Los documentos recuperados se incluyen en el prompt del LLM como contexto
- El LLM genera una respuesta basada en esos documentos y cita las fuentes
RAG en motores públicos
- Perplexity: RAG puro, busca en web cada consulta y cita
- ChatGPT Search: RAG sobre índice web cuando el modelo decide que lo necesita
- Google AI Overviews: RAG sobre el propio índice de Google
- Claude con web tool: RAG bajo demanda del usuario
Por qué RAG cambia el SEO/GEO
Antes de RAG, un LLM solo podía recomendarte si te había memorizado. Con RAG, cualquier página indexada puede ser citada aunque el modelo no la conociera antes. Eso democratiza: sitios nuevos pueden competir si están bien estructurados.
Qué ayuda a ser recuperado por RAG
- Títulos y H2 claros con la keyword/pregunta
- Fragmentos autocontenidos (RAG suele cortar la web en fragmentos de ~500 palabras)
- Schema rico
- AEO summary extraíble al inicio
- Datos específicos y fechados
¿Quieres saber si tu contenido está siendo recuperado por RAG de Perplexity, ChatGPT Search o AI Overviews? Se analiza en la auditoría gratis.