¿Por qué no está indexado mi sitio web?
La mayoría del SEO se dedica a ayudar a tu sitio web a obtener un mejor posicionamiento en los resultados de búsqueda de Google. Pero la calidad de su funcionamiento depende realmente de una sola cosa: tu sitio web debe ser indexado por Google.
Puedes tener el sitio web más rápido con el mejor contenido en la historia de la humanidad, pero si Google no lo indexa, nadie lo verá.
Así que, ¿cómo puedes saber si Google está indexando tus páginas?, y ¿qué medidas puedes tomar si no lo está haciendo?
Además, ¿qué es la indexación de Google?
Seguramente la mejor analogía para el modo en que funcionan los motores de búsqueda es una biblioteca. Si quisieras encontrar libros sobre un tema concreto, consultarías el catálogo de la biblioteca en busca de una lista de libros disponibles sobre dicho tema:
Google funciona básicamente de la misma forma. Cuando buscas algo en Google, no estás buscando directamente en internet, estás consultando el catálogo de Google. Google te devuelve una serie de opciones que considera adecuadas para tu solicitud en forma de resultados de búsqueda.
Google construye su índice haciendo clics en la red (rastreando), registrando información sobre las páginas en las que aterriza y almacenando dicha información en su índice (indexando).
Por tanto, puedes ver por qué es tan importante para tu SEO que compruebes si tu sitio web está siendo rastreado e indexado. Independientemente de la calidad de tus páginas, si no están en el catálogo, Google no las podrá mostrar.
¿Está tu sitio web indexado?
Hay varias formas de comprobar si tu sitio web ha sido indexado. Para los usuarios Pro y Premium de WooRank, el Informe Avanzado incluye los criterios de páginas descubiertas. Esta sección indica el número de páginas que hemos encontrado en el índice de Google.
También está el informe de estado de indexación de Google Search Console:
Otra opción es utilizar el operador de búsqueda «site:». Haz una búsqueda rápida en Google del tipo "site:ejemplo.com", sustituyendo ejemplo.com por tu sitio web. El resultado te dará una ligera idea sobre cuántas páginas de tu dominio ha indexado Google.
Por último, aunque no menos importante, puedes comprobar el estado de indexación de páginas individuales utilizando el operador de búsqueda «cache:». Solo tienes que buscar una página individual con el operador «cache:» delante (¡sin espacios!) para ver la versión más reciente de la página indexada por Google.
¿Qué evita que Google indexe tus páginas?
Has comprobado tu Informe Avanzado o tu informe de estado de indexación y muestra muchas menos páginas de las que tu sitio web contiene. Tienes un problema de rastreo o de indexación. ¿Qué causa estos problemas?
Probablemente no te guste la respuesta: puede deberse a numerosos errores diferentes. Muchos de ellos son extremadamente técnicos.
Pero esta es la respuesta que sí te gustará: no tiene por qué ser difícil, complicado ni técnico encontrar el problema. Solo necesitas un buen rastreador de SEO. Y, mira por dónde, el rastreador de sitios web de WooRank puede detectar esas causas complicadas y técnicas en tu lugar.
Le estás diciendo a Google que no lo haga
Existen ciertas cosas que pueden hallarse en tu sitio o en páginas individuales e indicar a Google que ignore una página. El problema podría ser que tu archivo robots.txt ha deshabilitado esa página o carpeta por error. O podrías haber añadido sin querer una metaetiqueta robots «NoIndexed» a tu página.
Para encontrar estas páginas, abre el rastreador de sitios web (la herramienta "œSite Crawl" de WooRank) y accede a la sección de indexación. Esta parte del análisis te mostrará las páginas que:
- Están deshabilitadas por el archivo robots.txt
- Tienen una metaetiqueta (o cabecera HTTP) robots NoFollow
- Están alojadas en una versión no canónica (más información a continuación) de tu URL
El rastreo de páginas también te indicará si la página no indexada aparece en el mapa web del sitio. Los mapas web no impiden que una página sea indexable, pero si dicha página no está incluida en el mapa, es mucho más difícil que Google la detecte.
Sin embargo, el archivo robots.txt y las etiquetas nofollow no son las únicas formas de indicar a Google que no indexe tu contenido.
Las etiquetas canónicas se utilizan para dirigir a los motores de búsqueda hacia la versión de una página que deseas que consideren como la versión original, o «canónica», de dicha página. Las etiquetas canónicas ayudan a gestionar el contenido duplicado y a consolidar el link juice.
Así puedes ver cómo la mala gestión de tus etiquetas canónicas puede causar que Google omita el rastreo de la página que deseas indexar.
Los problemas canónicos que pueden impedir que una página sea indexada son:
- Etiquetas que conducen a una página rota
- Múltiples etiquetas canónicas en una sola página
- URL canónicas que no concuerdan con la URL indicada en el mapa de tu sitio web
El rastreador de sitios web identificará estos problemas y te ayudará a averiguar dónde se hallan las etiquetas canónicas que indican a Google que no indexe una página.
Tus páginas o enlaces están rotos
Si una página no carga, no se indexa. Y como Google encuentra nuevas páginas siguiendo los enlaces, un enlace roto reduce las probabilidades de que Google rastree la página de destino. Por eso el análisis de rastreo del sitio web incluye una lista de páginas que devuelven errores HTTP que evitan que Google acceda a ellas:
- 5xx: Los servidores devuelven códigos de estado de tipo 500 cuando encuentran un error, normalmente en la parte del servidor, incluidos límites de tiempo superados y sobrecarga del servidor.
- 4xx: Los servidores devuelven códigos de estado de tipo 400 cuando el cliente (navegador web) efectúa una solicitud no válida. El error más conocido de este tipo es el 404 No encontrado.
- 3xx: Los códigos de tipo 300 indican un redireccionamiento. Técnicamente no tienen por qué ser errores, pero su uso incorrecto puede evitar que Google acceda a la página. Las URL que redirigen a URL rotas no se indexarán, pero Google también puede decidir no indexar páginas incluidas en cadenas de redireccionamiento. Atrapar a Google en un bucle de redireccionamientos también evitará que las páginas se indexen o rastreen.
Tienes algún problema de SEO en página
La misión de Google consiste en compartir los mejores resultados de búsqueda basándose en la solicitud del usuario. Por tanto, no le interesa mantener páginas que considera malos resultados en su índice. Uno de los mayores problemas en página que evitará que dicha página sea indexada es el contenido duplicado.
Probablemente sepas si tu sitio web incluye los ejemplos más obvios de contenido duplicado: copia parcial y plagio. Pero, lamentablemente, también puedes crear páginas con contenido duplicado por error, sin saberlo. Por suerte, el rastreador de sitios web tiene la capacidad de detectar páginas duplicadas, así como instancias de páginas no duplicadas que pueden parecer copias una de otra.
Si accedes a la sección de problemas en el contenido principal, encontrarás páginas detectadas por el rastreador de sitios web que incluyen contenido duplicado. Este tipo de páginas son habitualmente consecuencia de la organización en listas, la paginación u otros parámetros dinámicos de URL, y el problema puede solucionarse con la herramienta de parámetros de URL de Google y etiquetas canónicas.
Pero también puedes tener páginas con distinto contenido que sigue pareciendo el mismo. ¿A qué puede ser debido?
Etiquetas de título: Los títulos de página deben constituir una introducción al contenido de la página. Y aunque cada una de tus páginas incluya contenido único, Google podría considerar que los títulos duplicados identifican contenido copiado.
Metadescripciones: Al igual que los títulos, cada página debe presentar descripciones únicas asociadas a su contenido no duplicado.
Observa las URL de las páginas con descripciones o títulos duplicados. Según la cantidad de copias que existan, podrías haber generado un problema de plantilla o haber utilizado demasiado la opción copiar y pegar.
¡La indexación es muy importante!
Si has descubierto que tienes problemas para que tus páginas se indexen, efectúa un rastreo de tu sitio web para descubrir por qué. Solucionar los problemas que evitan que Google te encuentre y almacene tus páginas es realmente el primer paso para posicionarte en los resultados de búsqueda.
Si tienes un sitio web nuevo y estás intentando que Google lo detecte, echa un vistazo a nuestra guía de indexación.