Google explica en un video cómo elige las URL canónicas

URL canónicas

Gary Illyes, de Google, detalla las señales que emplea para seleccionar páginas canónicas y explica la importancia de las páginas duplicadas para el posicionamiento SEO orgánico.

En un reciente video de Google Search Central, Illyes de Google explica parte del proceso de indexación de páginas web, que incluye la selección de URL canónicas

En su explicación, aborda el significado de una URL canónica para Google, ofrece una visión general de las señales que influyen en la elección de las páginas web, hace referencia a la “pieza central” de una página y discute el tratamiento de las páginas duplicadas, lo que proporciona una nueva perspectiva sobre este tema para los profesionales del SEO.

¿Qué es una URL canónica?

La URL canónica es un concepto que puede entenderse desde distintas perspectivas, tanto desde la óptica del editor como desde el punto de vista del SEO, así como desde la perspectiva de Google.

URL canónica

Los editores suelen identificar lo que consideran la página web “original”, mientras que para los profesionales del SEO, representa la versión “más robusta” de una página web en términos de clasificación.

Sin embargo, para Google, la canonicalización implica un enfoque diferente al de los editores y los expertos SEO, y es esencial comprenderlo, como nos lo explica Gary Illyes, un miembro del equipo de Google.

La documentación oficial de Google sobre canonicalización emplea el término “deduplicación” para describir el proceso de selección de una URL canónica, y enumera cinco razones comunes por las cuales un sitio puede tener páginas duplicadas.

Estas razones incluyen:

  1. Variantes regionales: Por ejemplo, tener contenido dirigido a EE. UU. y al Reino Unido disponible en URLs distintas, pero que básicamente ofrecen el mismo contenido en el mismo idioma.
  1. Variantes de dispositivo: Como tener una versión diseñada para dispositivos móviles y otra para escritorio de una misma página.
  1. Variantes de protocolo: tener versiones del sitio disponibles en HTTP y HTTPS.
  1. Funciones del sitio: Como los resultados generados por las funciones de clasificación y filtrado en una página de categorías.
  1. Variantes accidentales: cuando los rastreadores acceden accidentalmente a una versión de demostración del sitio.

¿Qué señales se utilizan para elegir canónicas?

En el contexto de la indexación, Illyes comparte una definición adicional sobre la canonicalización y explica las señales que se emplean para elegir qué versiones son canónicas.

Según Illyes, Google determina si una página es un duplicado de otra ya conocida y qué versión debe mostrarse en la página de resultados de Google (SERP), conocida como la versión canónica. Esta elección se basa en las señales recopiladas sobre cada versión, seleccionando aquella que mejor representa al grupo de páginas duplicadas.

En la mayoría de los casos, sólo las páginas canónicas aparecen en los resultados de búsqueda. Para determinar qué página es canónica, Google agrupa el contenido de una página, especialmente su contenido principal o “pieza central”, con otras páginas que posean contenido similar, si existen, en un proceso llamado agrupación de duplicados.

Es interesante notar que Gary se refiere al contenido principal como la “pieza central de una página”, lo cual coincide con un concepto introducido por Martin Splitt de Google llamado la “anotación central”. Aunque no se explica completamente qué es esta anotación, el fragmento compartido por Gary proporciona un indicio.

Illyes luego explica que las “señales” son fragmentos de información recopilados por el motor de búsqueda sobre páginas y sitios web, utilizados para su posterior procesamiento. Estas señales incluyen desde anotaciones del propietario del sitio en HTML, como rel= “canonical”, hasta aspectos menos directos, como la importancia de una página específica en internet.

Te puede interesar: Google: rel=canonical no es una garantía absoluta en la canonización

Los clústeres duplicados tienen una canónica

A continuación, Gary explica cómo se elige una página para representar la versión canónica de cada grupo de páginas duplicadas en los resultados de búsqueda. En cada conjunto de duplicados, se establece una página canónica.

Continúa explicando que cada conjunto de duplicados tendrá una única versión del contenido seleccionada como canónica. Esta versión será la representante del contenido en los resultados de búsqueda para todas las demás versiones. 

Las otras versiones del grupo se convierten en versiones alternativas que pueden servirse en diferentes contextos, como cuando el usuario busca una página específica del clúster.

Versiones alternativas de páginas web

versiones alternativas web

Esta última parte es muy interesante y es importante tenerla en cuenta, ya que puede resultar útil para poder posicionarse para múltiples variaciones de una palabra clave, especialmente en el contexto de las páginas web de ecommerce.

En ocasiones, el sistema de gestión de contenidos (CMS) genera páginas web duplicadas para dar cuenta de las variaciones de un producto, como el tamaño o el color, lo cual puede afectar luego a la descripción. 

Google puede elegir estas variaciones para clasificarlas en los resultados de búsqueda cuando una página variante se ajusta mejor a una consulta de búsqueda.

Es fundamental considerar esto, ya que puede ser tentador aplicar la etiqueta noindex a las páginas web de variantes para mantenerlas fuera del índice de búsqueda por temor a problemas (que en realidad no existen) de canibalización de palabras clave. 

Sin embargo, agregar un noindex a las páginas que son variantes de una página puede ser contraproducente, pues existen situaciones en las que esas páginas variantes son las más adecuadas para posicionarse para una consulta de búsqueda más específica que incluye colores, tamaños o números de versión diferentes a los de la página canónica.

Te puede interesar: ¿La canonicalización es un factor de posicionamiento en Google?

Puntos principales sobre canonicals (y más) para recordar

La discusión de Gary sobre canonicals contiene una gran cantidad de información, que abarca algunos temas secundarios relacionados con el contenido principal. A continuación, se presentan siete puntos a tener en cuenta:

  1. El contenido principal es referido como la “pieza central”.
  2. Google calcula un “conjunto de señales” para cada página que descubre.
  3. Las señales son datos utilizados para el “procesamiento posterior” una vez que se han descubierto las páginas web.
  4. Algunas señales están bajo el control del editor, como las indicaciones (y presumiblemente las directivas). La indicación mencionada por Illyes es el atributo rel=canonical.
  5. Otras señales están fuera del control del editor, como la importancia de la página en el contexto de internet.
  6. Algunas páginas duplicadas pueden servir como versiones alternativas.
  7. Las versiones alternativas de las páginas web pueden seguir clasificándose y son útiles para Google (y el editor) en términos de clasificación.

Ahora que ya sabes qué es una URL canónica y cómo Google las elige, podrás optimizar mejor tus páginas web para mejorar su visibilidad en los resultados de búsqueda y evitar problemas de contenido duplicado. ¡Aprovecha esta información para mejorar tu estrategia de SEO y aumentar el tráfico hacia tu sitio web!

Texto traducido y adaptado de: Google Explains How It Chooses Canonical Webpages

¿Estás interesado en posicionarte orgánicamente en Google? En Capybara SEO podemos ayudarte con diferentes estrategias para impulsar tu visibilidad en la web, aumentar el tráfico de tu sitio y mejorar tu ranking en los resultados de búsqueda. ¡Contáctanos ahora y lleva tu estrategia de SEO al siguiente nivel!

Gerente y Fundador de Capybara SEO. Co-Fundador en Norte Digital Perú. Especialista consultor en posicionamiento web, gestión de pautas de pago y marketing en buscadores. Más de 12 años de experiencia administrando campañas de posicionamiento web para empresas en Perú, Chile, Argentina, EEUU, Inglaterra, Bélgica y Holanda.