Cuando OpenAI entrena un modelo nuevo (GPT-5, GPT-6…) necesita datos. GPTBot es el bot que recorre la web recopilándolos. Si tu contenido está permitido para GPTBot, hay más probabilidad de que el modelo te conozca de memoria y te recomiende sin buscarte en tiempo real.
Cómo permitirlo o bloquearlo
En robots.txt:
User-agent: GPTBot
Allow: /
Disallow: /panel/
Disallow: /api/
¿Bloquearlo o permitirlo?
Para una agencia que vende GEO, permitir GPTBot es obligatorio. Para una editorial que vive de paywall, bloquear puede tener sentido.
- Permitir: tu contenido entra en datos de entrenamiento. GPT te cita de memoria en respuestas sin necesidad de que busque en vivo.
- Bloquear: proteges el contenido de ser usado por OpenAI. Pierdes visibilidad futura cuando GPT-5 o GPT-6 no te conozcan.
Otros crawlers de OpenAI
- OAI-SearchBot: crawler de ChatGPT Search en tiempo real. Bloquearlo en 2026 es suicidio.
- ChatGPT-User: se activa cuando un usuario pide a ChatGPT que abra una URL concreta.
Señales de que GPTBot te visita
- Logs de Nginx/Apache: user-agent "GPTBot/1.x"
- Cloudflare: Security > Events filtrando por bot verified
Frecuencia típica en un sitio mediano: varias visitas al día una vez te descubre.
En el robots.ts de NoSolo Agencia los 17 crawlers de IA están declarados con su política óptima. Si quieres ver la tuya, auditoría gratis.