La canonicalización de URLs es el proceso de decidir cuál es la versión definitiva de una URL y luego agregar la etiqueta canonical en todas las páginas que enlacen hacia la página definitiva.
¿Qué es una etiqueta canonical?
La etiqueta canonical, también llamada "rel canonical" es una etiqueta HTML que le dice a los motores de búsqueda que la URL adjunta es la versión original y definitiva de la página. La URL "canonicalizada".
La etiqueta va en la sección <head> de la página y se vería así:
<link rel="canonical" href="https://www.ejemplo.com">
En términos prácticos, la etiqueta canónica le dice a Google qué página deseas que aparezca en los resultados de búsqueda.
¿Por qué importan las etiquetas canonical?
Los humanos tienden a pensar en páginas que se ven iguales y tienen el mismo contenido como una sola página. Sin embargo, los motores de búsqueda no funcionan de la misma manera. Ven diferentes URL como páginas diferentes, incluso si tienen el mismo propósito.
Entonces, para Google, todas estas URL son páginas únicas:
- https://www.ejemplo.com
- www.ejemplo.com/
- https://www.ejemplo.com/index.php
- ejemplo.com
Para Google, aquí tienes cinco copias únicas de tu página de inicio, aunque todos los humanos verán una sola página. Esta situación puede hacer que sufras algunos de los problemas asociados con el contenido duplicado.
Esto es lo que sucede cuando Google se encuentra con tres de estas URLs:
Agregar etiquetas canónicas a las cuatro copias vinculadas a tu URL canónica le dice a Google que ignore las copias y continúe con el original:
Los sistemas y sitios web modernos de gestión de contenido pueden causar este problema cuando muestran contenido dinámico según el usuario. Las plataformas de comercio electrónico también pueden ser culpables aquí cuando muestran múltiples versiones del mismo producto (color, tamaño, número de modelo, etc.).
El contenido duplicado también puede ser útil, como cuando creas páginas de destino que son muy ligeramente diferentes. Esta es una práctica relativamente común para PPC y campañas de correo electrónico.
¿Cómo ayuda esto a tu sitio?
Si bien no existe una "penalización por contenido duplicado" en Google, las páginas duplicadas pueden causar serios problemas para la optimización de tu motor de búsqueda:
- Diluyendo la contrucción de enlaces: los usuarios no siempre llegan a la versión correcta de una URL. A menudo dejan fuera la parte https o agregan una barra inclinada final. Sin una etiqueta canonical, el link juice pasado por esos enlaces no se asignará a la página correcta.
- Desalentando los rastreos: tener contenido duplicado hace que los rastreadores de Google "pierdan" su tiempo mirando copias del contenido que ya han visto. Es menos probable que Google vea más páginas en tu sitio si piensan que está duplicado.
Agregar etiquetas canonical a tus páginas
Como se mencionó anteriormente, el código para una etiqueta canonical se ve así:
<link rel="canonical" href="https://www.ejemplo.com">
Va en la sección <head> de una página. El encabezado de una página es todo el código que aparece entre las etiquetas <head> y </head> del código HTML de una página.
La forma en que agregues etiquetas canonical a tus páginas dependerá por completo del tipo de sitio que tengas. Si tienes un sitio de WordPress, puedes usar uno de estos complementos de SEO para agregarlas:
Buenas prácticas de etiquetas canonical
Si bien la etiqueta canonical es un código relativamente simple de agregar, es absolutamente vital seguir las mejores prácticas al usarla. Dado que le dicen a Google que esencialmente ignore la página en la que se encuentra y pase a la URL canónica, puede arruinar fácilmente el SEO de tu sitio.
Canonicals de autorreferencia
Las páginas no tienen que usar etiquetas canónicas autorreferenciadas, pero no está de más hacerlo. Una canonical autorreferenciada es cuando una página contiene una etiqueta canónica que se vincula a sí misma. Por ejemplo, cuando https://www.ejemplo.com/page1 contiene esta etiqueta canonical:
<link rel="canonical" href="https://www.ejemplo.com/page1">
Nuevamente, no tienes que hacer esto, pero hacerlo no hace daño. Esto puede parecer obvio a primera vista, pero es una pregunta común en el mundo del SEO.
Asegúrate de que tu URL canónica sea accesible
De nuevo, esto es probablemente obvio. ¿Por qué diríamos que una página es la versión definitiva y luego redirige a Google a otra URL? ¿O a una URL que devuelve un 404? ¿O una URL que está bloqueada por el archivo robots.txt? Sin embargo, sucede.
Solo canoniza las URL que devuelven un código de estado 200 y están permitidas en su archivo robots.txt. Asegúrate de que tu URL canónica también aparezca en el sitemap XML. Verifica las URL canónicas para las etiquetas noindex.
Verifica tus etiquetas canonical si estás utilizando un programa que las crea dinámicamente. Algunos complementos y plataformas de gestión de contenido escribirán un canónico de autorreferencia exclusivo para cada URL publicada en tu sitio, lo que anula por completo el propósito de la canonicalización de URL.
Usar URL absolutas
Al agregar una URL a una etiqueta canónica, siempre incluye la URL completa. Lo que significa que la URL debe incluir estas partes:
- El https://
- Las www (si son parte de tu dominio preferido)
- Tu nombre de dominio.
- La parte .com.
Estas se conocen como "URL absolutas". Las URL que solo incluyen la parte que viene después de ".com" se conocen como "URL relativas" y no se reconocen cuando Google lee su etiqueta canonical.
Si no utilizas una URL absoluta, Google ignorará la etiqueta.
PUEDES canonizar a través de dominios
Si posees el sitio web A (sitioa.com) y el sitio web B (sitiob.com), puedes señalar con una canonical del sitio A al sitio B. Esto tiene sentido para las compañías de medios que publican el mismo contenido en múltiples propiedades, pero solo quieren posicionar un sitio web.
No crees "cadenas canónicas"
Acabamos de inventarnos el término "cadenas canónicas", pero piensa en ellas como agregar una etiqueta a la página A apuntando a la página B. Y luego agregar una etiqueta canónica de la página B apuntando a la página C. Esto brinda una señal ambigua a Google ya que estaríamos diciéndole que dos URLs diferentes son la versión definitiva de la página.
Situaciones canónicas ambiguas como estas probablemente harán que Google ignore tus canonical.
En su lugar, elige una versión canónica (página C) y luego señala hacia ella todas las versiones. Por lo tanto, coloca etiquetas canónicas que enlacen a la página C en la página A y en la página B.
Errores comunes de etiquetas canónicas
Nadie es perfecto. De vez en cuando puedes cometer errores con tus etiquetas canonical. Estos son los errores más comunes que cometen las personas con su canonicalización de URL.
Canonicals y paginaciones
Puedes usar etiquetas canonical junto con contenido paginado. Esto no es un error. Sin embargo, a menudo ocurren errores cuando los usuarios agregan accidentalmente una etiqueta canonical a cada página que apunta a la página 1. Entonces, por ejemplo, https://www.ejemplo.com/content_page1 debería tener esta etiqueta canónica:
<link rel="canonical" href="https://www.ejemplo.com/content_page1">
Mientras que la página siguiente en la cadena, https://www.ejemplo.com/content_page2, debe tener esta etiqueta:
<link rel="canonical" href="https://www.ejemplo.com/content_page2">
Las personas se encuentran con problemas cuando agregan esta etiqueta a https://www.example.com/content_page2:
<link rel="canonical" href="https://www.ejemplo.com/content_page1">
Esto evitará que Google indexe la segunda página de contenido.
Canonicals y hreflang
Una vez más, usar etiquetas canonical y etiquetas hreflang está perfectamente bien. Pero son fáciles de equivocar al canonizar accidentalmente una página en un idioma a la misma página en otro. Lo cual es el trabajo de la etiqueta hreflang.
Si usas etiquetas hreflang y canonical juntas, verifica las canonical de la página en inglés con la URL en inglés y las canonical de la página en español con la URL en español.
Por ejemplo, si https://www.ejemplo.com es la URL canónica que también está disponible en español, las etiquetas canonical y hreflang deberían tener este aspecto:
<link rel="canonical" href="https://www.ejemplo.com">
<link rel="alternate" hreflang="en" href="https://www.ejemplo.com">
<link rel="alternate" hreflang="es" href="https://www.ejemplo.com/es">
Suficientemente simple pero fácil de generar errores si no prestas suficiente atención.
Uso de etiquetas canonical en páginas que no son similares
Es común que los sitios web tengan varias páginas que cubren el mismo tema. En WooRank, tenemos múltiples publicaciones de blog sobre investigación de palabras clave, marketing de contenidos, SEO avanzado y muchos otros temas. Un sitio de comercio electrónico puede tener dos productos diferentes que son muy similares en descripción y especificaciones.
Sin embargo, estas páginas tienen dos propósitos muy diferentes y ninguno de ellos, a pesar de que son bastante similares, debe incluir enlaces canónicos a la otra.
Si utilizas etiquetas canonical de forma demasiado agresiva, Google podría decidir dejar de confiar por completo en tu sitio. Lo que significa que no respetará las etiquetas canonical en ninguna página, lo que generará los posibles problemas de contenido duplicado mencionados anteriormente.
¿Qué sigue?
Una vez que comprendes las etiquetas canonical, no es un tema tan complicado. Si sigues las mejores prácticas, puedes usar fácilmente etiquetas canónicas para mantener tu sitio web optimizado para los rastreadores de Google.
Si ya estás usando etiquetas canonical, considera auditar tu sitio web con el Site Crawl de WooRank o un software de rastreo de sitios web diferente para asegurarse de que estás siguiendo las mejores prácticas.