¿Qué es un XML Sitemap?
Un XML Sitemap (mapa de sitio en XML - lenguaje de marcas extensible) es un archivo de texto utilizado para detallar todas las URLs de un sitio web. Puede incluir información adicional (metadatos) sobre cada URL, como detalles sobre la fecha de la última actualización, su relevancia y la existencia de otras versiones de la URL en otros idiomas. Esta información se utiliza para ayudar a los motores de búsqueda a revisar tu sitio web con mayor eficiencia, permitiendo informar sobre todos los cambios de forma directa, incluidas la adición de una página nueva y la eliminación de una antigua.
Ejemplo de índice de mapas de sitio
Un sitemap XML no garantiza en ningún caso que tus páginas sean revisadas o indexadas por motores de búsqueda, pero tener uno aumenta sin lugar a dudas tus posibilidades, especialmente si la navegación o estrategia general de enlazado interno de tu sitio no conduce a todas tus páginas.
Glosario de etiquetas utilizadas en un índice de mapas de sitio
<urlset> - El mapa del sitio se abre y se cierra con esta etiqueta. Es el protocolo estándar actual.
<url> - Esta es la etiqueta principal para cada entrada de URL.
<loc> - Esta etiqueta contiene la URL absoluta o el localizador de la página.
<lastmod> - Contiene información sobre la última fecha de modificación del archivo. Debe estar en formato AAAA-MM-DD.
<changefreq> - Contiene información sobre la frecuencia con la que se cambia un archivo.
<priority> - Esto indica la importancia del archivo dentro del sitio. El valor varía de 0.0 a 1.0.
<xhtml:link> - En este caso, esta etiqueta se utiliza para proporcionar detalles de URL alternativas que se ofrecen en otros idiomas.
NOTA:
- La etiqueta «loc » es obligatoria, mientras que las etiquetas «lastmod », «changefreq » y «priority » son opcionales.
- De forma ideal, un XML sitemap debería añadirse al directorio raíz del sitio web. Todas las URL incluidas en el mapa del sitio deben proceder del mismo servidor.
- Solo debe incluirse la versión canónica de las URL de todas las páginas, así que las páginas no deberían devolver o redirigir a un estado de error.
- La longitud máxima de una URL es de 2.048 caracteres.
- Aunque parece posible manipular los motores de búsqueda para que piensen que el contenido de tu página se actualiza frecuentemente declarando la etiqueta «changefreq » como «daily », no es recomendable hacerlo. Si las etiquetas de frecuencia y prioridad no reflejan la realidad, es probable que las arañas de los motores de búsqueda las ignoren.
- Todas las URL del mapa del sitio deben proceder del mismo servidor.
- Si necesitas ayuda para construir el mapa de tu sitio web, existen varias herramientas de generación de mapas que pueden ayudarte.
índice de mapas del sitio
Al utilizar múltiples archivos de mapa en un solo sitio web, cada uno de ellos debe incluirse en una lista colectiva contenida en un archivo independiente llamado índice de mapas del sitio.
Puedes necesitar múltiples mapas en XML si cuentas con más de 50.000 URL en un solo sitio o si el mapa del sitio supera los 10 Mb. En tal caso, deberás crear otro XML sitemap. Tienes la opción de reducir el uso de ancho de banda del sitio comprimiendo el archivo del mapa del sitio mediante G-Zip, pero debes asegurarte de que no supere los 10 Mb una vez descomprimido.
Puedes ver un ejemplo de índice de mapas de sitio a la izquierda.
Glosario de etiquetas utilizadas en un mapa de sitio
<sitemapindex> - El archivo de índice de Sitemap se abre y cierra con esta etiqueta. Incluye todos los mapas de sitio XML en el archivo.
<sitemap> - Esta etiqueta incluye información sobre Sitemaps individuales.
NOTA: Un índice de mapas de sitio puede enlazar un máximo de 50.000 archivos de mapa de sitio en XML.
¿Qué tipos de archivo admiten los mapas de sitio en XML?
Google puede detectar distintos tipos de archivo de mapas de sitio. Son específicos para el tipo de contenido incluido en el sitio y ayudan a los motores de búsqueda a identificar los archivos con mayor facilidad.
Lista de tipos de archivo del mapa de sitio:
- HTML
- Video
- Imágenes
- Móviles
- Noticias
Herramientas para generar mapas de sitio
- Screaming Frog SEO Spider and Sitemap generator
- Enarion phpSitemapsNG
- XML-Sitemaps
- Perl Sitemap Generator One
- Simple Sitemaps One
- Free Sitemap Generator One
Plugins CMS para generar mapas de sitio en XML
Esquemas de sitemaps y herramientas de validación de sitemaps
El esquema XML (XSD) para el protocolo Sitemaps 0.9 y las extensiones compatibles te proporcionan los elementos y atributos que necesitas incluir en tus XML sitemaps. Los esquemas (según el sitemaps, los índices de mapas y distintos tipos de archivo de mapa admitidos) son los siguientes:
Tras crear los sitemaps con todos los elementos y atributos adecuados, valídalos utilizando una de las siguientes herramientas:
Para analizar el sitemap antes de enviarlo a Google Search Console, haz clic en el botón rojo «Añadir o probar Sitemap » a la derecha e introduce la URL del mapa de sitio que deseas analizar, como se muestra en las imágenes de abajo.
NOTA: Esta función se utiliza también para enviar el mapa de tu sitio a Google. Otro método que deberías utilizar para informar a los motores de búsqueda sobre tu sitemap es la adición del siguiente código a tu archivo «robots.txt »:
Sitemap: http://example.com/sitemap.xml
Puedes añadirlo en cualquier parte del archivo «robots.txt » porque la directiva es independiente de la línea «user-agent ». También puedes especificar más de un archivo de mapa de sitio por archivo «robots.txt ». Siempre que actualices el sitemap puedes reenviarlo a Google utilizando la misma opción «Añadir o probar Sitemap ».
NOTA AVANZADA: También puedes enviar el sitemap como solicitud HTTP. Para ello debes enviar una solicitud a la siguiente URL:
<searchengineURL>/ping?sitemap=<sitemapURL>
Lo podrás ver en el siguiente ejemplo:
http://www.google.com/webmasters/tools/ping?sitemap=http://www.yoursite.com/sitemap.xml
Añade la URL después del código ping?sitemap=
www.google.com/webmasters/tools/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.xm
Efectúa la solicitud HTTP utilizando wget, curl u otro método sugerido por tu desarrollador web.
Sitemap para imágenes
Si tu sitio utiliza muchas imágenes, lo más lógico es guiar a los motores de búsqueda hacia las URL de tus imágenes mediante un mapa de las imágenes del sitio.
Abajo puedes ver un ejemplo de mapa de imágenes de un sitio.
Glosario de etiquetas utilizadas en un mapa de imágenes de un sitio.
<image:image> - Esta etiqueta encierra cada URL de imagen. Puede enumerar hasta 1000 de esas etiquetas.
<image:loc> - Esta contiene la URL de la imagen.
<image:caption> - Esta etiqueta contiene un título para la imagen. Es opcional.
<image:geo_location> - Puede especificar una ubicación geográfica de la imagen en esta etiqueta. Es opcional.
<image:title> - Este contiene un título para la imagen. Es opcional.
<image:license> - Esta etiqueta contiene la URL que apunta a la licencia de la imagen. Es opcional.
Tal vez no sea posible indexar tu sitio al completo, incluso con el sitemap perfecto, pero puedes descubrir problemas de indexación en tu sitio a partir de un sitemap sin errores. Para ello, efectúa una comprobación de errores de todos los sitemaps con Google Search Console y las herramientas para webmasters de Bing, compara las páginas indexadas en relación con las URL que has enviado y, si existe una gran diferencia en esta relación o aparece repentinamente un aumento o disminución de estos valores, comprueba tus sitemaps. Es posible que detectes otros problemas, como errores en el archivo «robots.txt », contenido duplicado, etc. Existen numerosas herramientas que pueden utilizarse para importar y revisar todas las páginas mencionadas en tus sitemaps (como Screaming Frog), permitiéndote detectar con facilidad cualquier problema o redirección innecesaria.
XML sitemap
El XML sitemap te permite monitorizar todos tus mapas de sitio desde un solo lugar, proporcionando un resumen de los mapas de sitio que has enviado a través de la cuenta de Google Search Console, que incluye un extracto con diversos datos, como el tipo de mapa, las fechas de procesamiento más recientes, posibles problemas identificados y el número de páginas enviadas/indexadas por cada sitemap y en conjunto.
También es posible analizar y reenviar sitemaps haciendo clic en el mapa que deseas enviar y seleccionando después el botón «Reenviar Sitemap » o «Probar Sitemap ».