Canonicalización SEO y los errores más comunes
¿Qué es la canonicalización?
En términos SEO, canonicalizar significa elegir la mejor URL para mostrar un mismo contenido.
Tener diferentes URLs con el mismo contenido puede darnos problemas de contenido duplicado en los buscadores, por eso es importante que todo contenido de una página web solo sea accesible a través de una URL única. Esta URL es conocida como "˜URL canónica"™.
Aunque las siguientes URLs muestran el mismo contenido y se refieren a la misma página, técnicamente son todas diferentes (también para los motores de búsqueda):
- http://ejemplo.com
- http://www.ejemplo.com
- http://ejemplo.com/index.html
- https://www.ejemplo.com
- http://www.ejemplo.com/index.html
- http://www.ejemplo.com/?loc=1234
Esta duplicidad puede crear numerosos problemas en una web:
- Dilución de la autoridad de la página causada tanto por enlaces entrantes internos como externos apuntando a diferentes versiones URL de la misma página.
- Canibalización en los resultados de búsqueda con diferentes versiones de la misma página compitiendo por los mismos términos.
- Posible penalización, ya que una web con mucho contenido duplicado es una web de baja calidad.
- Los motores de búsqueda "pierden el tiempo" rastreando el mismo contenido y dejando menos tiempo para descubrir nuevo contenido.
La solución más sencilla suele ser crear redirecciones 301 desde las URLs no canónicas hacia las versiones canónicas o añadir la etiqueta rel="canonical" en la sección de cada una de las páginas de la web que apunte hacia la URL canónica.
Rel = canonical está soportado por la mayoría de los motores de búsqueda, como Yahoo!, Bing y Google.
En la agencia de Inbound Marketing realizamos auditorías SEO continuamente, y este suele ser uno de los puntos más importantes y también donde más errores se cometen. Vamos a ver, de una forma práctica, como dar solución a este factor SEO tan importante.
Cómo detectar problemas de canonicalización
Páginas no canonicalizadas apropiadamente
Yo suelo detectar problemas canónicos usando Screaming Frog. Para los que no estéis muy familiarizados con esta herramienta, podéis encontrar más información en la última presentación de Iñaki Huerta en el clinic SEO sobre Screaming frog.
Después de rastrear el sitio web con esta herramienta, ordeno desde la pestaña Internal de forma alfabética por Address. A la derecha busco la columna Canonical Link Element 1 en la que compruebo si las URLS tienen un enlace que apunte a la versión canónica, o si existe una redirección 301.
Aclaración:
- Es correcto tener una etiqueta canonical que se auto-referencie en cada página.
- La redirección hacia la versión canónica debe hacerse con 301 y NO CON UN 302.
Versión no-www de las URLs no redirigidas con 301
Encontrar títulos duplicados puede ser síntoma de contenido duplicado. Desde la pestaña "Page Titles" en Screaming Frog filtro por "˜Duplicate"™ para buscar URLs con este problema.
En este punto también comprobamos URLs con /index.html, /index.php.. etc y versiones con "/" o sin ella al final de la URL.
También podemos hacerlo de forma manual desde el navegador: añadir la barra "/" al final de una url y comprobar si se redirige a la versión sin "œ/".
Se puede acceder al site a través de HTTPS (protocolo seguro) y HTTP (no-seguro)
En este punto simplemente podemos hacer pruebas accediendo manualmente a algunas páginas para ver si la versión segura de la URL redirige hacia la no segura o viceversa, según la configuración. El plugin de Ayima nos ayudará a ver qué tipo de redirección existe.
URLs accesibles tanto en mayúsculas como en minúsculas
Para evitar contenido duplicado causado por URLs con diferentes tamaños de letra y preservar el page authority, se debe configurar el sitio para redirigir a URLs en minúsculas.
Los parámetros de URL crean contenido duplicado
Desde Search Console podemos identificar estos parámetros problemáticos que pueden estar provocando una pérdida de tiempo en el rastreo y creando contenido duplicado.
La IP no canonicaliza
La dirección IP de cualquier sitio web debe resolver contra el nombre de dominio.
Yo suelo hacer un ip reverse del dominio para averiguar la ip del servidor donde la web está alojada y después introduzco dicha ip en el navegador para comprobar si redirige o no.
Cómo solucionar problemas de canonicalización
- Poner un tag canonical en todas las URL.
Ejemplo de la etiqueta canonical que deben incluir todas las páginas:
También se puede añadir el tag "˜noindex"™ en las páginas duplicadas y/o añadir los parámetros que no creen contenido único al archivo robots.txt. ¡OJO! siempre y cuando estas páginas con parámetros no hayan recibido una cantidad significativa de enlaces.
- Redirigir las URLs sin "/" al final a urls con "/" o viceversa para consolidar URLs.
Para redireccionar todas las páginas sin barra a la versión con barra al final, se debe usar la siguiente regla en el .htaccess con la función "˜mod rewrite"™ activada:
<IfModule mod_rewrite.c>
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !(.*)/$
RewriteRule (.*) http://www.example.com/$1/ [R=301,L,QSA]
</IfModule>
- Redirigir de URLs con uso de mayúsculas a minúsculas por el mismo motivo.
En primer lugar, se debe declarar RewriteMap en el fichero httpd.conf.
<IfModule mod_rewrite.c>
RewriteMap lc int:tolower
A continuación, se crea la redirección 301.
<IfModule mod_rewrite.c>
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} [A-Z]
RewriteRule ^(.*)$ ${lc:$1} [R=301,L]
</IfModule>
- Se deben canonicalizar todas las páginas con URLs absolutas y no relativas.
- Para redireccionar la ip debemos añadir en el .htacces, después de RewriteEngine on la siguiente regla:
RewriteCond %{HTTP_HOST} ^5\.9\.198\.121
RewriteRule (.*) http://www.ejemplo.com/$1 [R=301,L]
- Para eliminar index.html o index.php de las URLs se debe añadir en el .htacces, después de RewriteEngine on la siguiente regla:
RewriteCond %{THE_REQUEST} ^.*/index.php
RewriteRule ^(.*)\.(php|html)$[ http://www.ejemplo.com/](http://www.mydomain.com/)$1 [R=301,L]
Tocar el archivo .htacces exige un nivel técnico y conlleva cierto riesgo, por lo que aconsejo que las anteriores reglas las supervise tu informático o el administrador web que las deba implementar y compruebe la sintaxis y que dichas reglas no afecten a redirecciones ya existentes.
Algo que siempre hacemos en We Are Marketing es aplicar la filosofía Kaizen (totalmente aconsejada), que se basa en hacer pequeñas mejoras continuas, analizando los resultados de los cambios y actuar de nuevo para introducir nuevos cambios que nos permitan seguir mejorando.
Cuando debamos realizar muchos cambios SEO, sobretodo después de una auditoría, aplicar los cambios de uno en uno es importante ya que nos evita complejidades y nos permite analizar el resultado de cada una de las mejoras aplicadas. Si aplicaramos todas a la vez no sabríamos cuál ha funcionado y cuál no.