El sitemap no hace que Google indexe una página (eso depende de calidad y autoridad), pero sí ayuda a que la descubra antes. En sitios grandes con miles de URLs, es imprescindible.

Estructura básica

Un sitemap.xml estándar contiene:

  • <loc>: URL absoluta
  • <lastmod>: fecha de última modificación (crítico para Google y para Perplexity)
  • <changefreq>: frecuencia estimada de cambio (daily, weekly, monthly). Google la ignora bastante.
  • <priority>: prioridad relativa 0.0 a 1.0. Google también la ignora mayormente.

Reglas importantes

  1. Máximo 50.000 URLs por sitemap o 50 MB. Si superas, divide en varios con sitemap index.
  2. Solo URLs indexables: nunca incluyas páginas con noindex, canonical a otra, o bloqueadas por robots.txt.
  3. URLs absolutas con el protocolo correcto: https://, no // ni rutas relativas.
  4. lastmod actualizado: muy importante para que Google y Perplexity prioricen lo nuevo.
  5. Declarar en robots.txt: añade Sitemap: https://tudominio.com/sitemap.xml al final.
  6. Enviar en Google Search Console: opción "Sitemaps" en el panel. Acelera el descubrimiento.

Sitemap index para sitios grandes

Cuando superas unas 500-1.000 URLs y tu contenido es heterogéneo, conviene un sitemap index que apunta a sub-sitemaps por tipo:

  • sitemap-guias.xml
  • sitemap-landings.xml
  • sitemap-glosario.xml
  • sitemap-casos.xml

Ventajas: más fácil diagnosticar qué sección se indexa mal, actualizar solo la sección que cambia, y Google prioriza mejor cada tipo.

Sitemap dinámico vs estático

En 2026 casi siempre se genera dinámicamente desde tu base de datos (en Next.js con app/sitemap.ts). Ventajas:

  • Siempre actualizado: cuando publicas contenido nuevo, aparece al instante
  • lastmod real: sacado del updatedAt de la DB
  • Sin mantenimiento manual

Errores típicos

  • Incluir URLs noindex o con canonical a otro lado
  • lastmod con la fecha de hoy siempre (Google detecta que es falso y deja de confiar)
  • URLs con 404 en el sitemap (marca negativa)
  • Sitemap no enlazado desde robots.txt
  • Superar los 50.000 URLs sin dividir en sitemap index

Sitemap y GEO

Los crawlers de IA (PerplexityBot, ClaudeBot, GPTBot) también leen sitemap. Un sitemap limpio y con lastmod real les ayuda a priorizar tu contenido más reciente. Si publicas un estudio original, un sitemap que refleje el cambio acelera que aparezca citado.

¿Te revisamos el sitemap? Es uno de los primeros puntos de la auditoría técnica.