Imagina que has escrito una grandiosa obra con el objetivo de participar en un importante concurso. Se la muestras a dos colegas para que hagan las revisiones de lugar. A ellos le parece tan buena, que deciden –de buena fe– sacarle una copia para enviarla al mismo concurso que tú, sin ser conscientes de que ya estás participando.

Ambos olvidaron especificar en los datos que tú eres el autor original, y pusieron sus nombres.

Llega la hora de la evaluación y los jueces encuentran la misma obra repetida 3 veces. Aquí hay varias posibilidades:

  • Los jueces detectan que tu eres el autor original y deciden darte el premio.
  • Los jueces creen que la enviaste tres veces para engañarlos y aumentar tus probabilidades de ganar, y te descalifican.
  • Los jueces otorgan el premio y la autoría a uno de tus colegas. La original que enviaste es interpretada como una copia.

Para evitar consecuencias negativas, lo correcto es que tus colegas especifiquen en los datos que tú eres el autor original. Así, cuando los jueces vean tu nombre en las copias, las descartarán y se concentrarán en tu obra.

Incluso es posible que vean con muy buenos ojos que otros colegas hayan recomendado tu obra, y repercuta positivamente en los resultados.

De la misma manera funciona el contenido duplicado seo en tu sitio web. Sobre todo eso hablaremos en este artículo.

Índice

    1. Conceptos claves
    2. ¿Qué es?
    3. ¿Por qué debe importarte?
    4. Ejemplos
    5. ¿Es obligatorio solucionarlo?
    6. ¿Cómo solucionarlo?
    7. ¿Cómo detectarlo?
    8. Preguntas Frecuentes
    9. Referencias

Para que entiendas a la perfección la cuestión del contenido duplicado, debes manejar tres conceptos claves:

Concepto#1: Distintas URLs pueden dirigir hacia la misma página.

Es posible acceder al mismo contenido a través de diferentes URLs.

Toma en cuenta que la más mínima variación en su estructura la convierte en una URL nueva, puede ser quitar uno o varios caracteres o añadirlos.

Las URLs de abajo son distintias entre sí, pero  si accedes a cada una de ellas te llevarán a la misma página, o sea, al mismo contenido.

www.mascotas.ej/perros
www.mascotas.ej/perros?986
www.mascotas.ej/perros/
www.mascotas.ej/perros?347&raza=true

Son varios los motivos por los cuales se crean esas nuevas URLs, uno de ellos te la explico a continuación:

Concepto#2: Esas nuevas URLs son creadas por los usuarios, de manera no intencionada.

Los usuarios son los responsables de la mayor parte de las URLs duplicadas de tu web.

La razón principal es que tras realizar una búsqueda interna en tu web o tras aplicar un filtro de información, se añaden nuevos caracteres a la URL, mejor conocidos como parámetros.

Esa nueva URL dirige a los usuarios hacia la misma página que apunta la original.

Concepto#3: Una página puede tener decenas de URLs diferentes, pero solo hay una “original” y se le denomina URL canónica.

Solo una de ellas será la que debe aparecer en los resultados de búsqueda, tu labor será hacerle entender a Google cuál de todas es la URL más importante y cuáles son las duplicadas.

¿Qué es?

El contenido duplicado seo es aquel contenido que aparece repetido en múltiples URLs. Puede ser sólo un párrafo o un artículo completo. Se puede presentar entre páginas internas de tu sitio o entre contenido publicado en otra web y la tuya.

No deben ser exactamente iguales para considerarse duplicados, basta con que sean muy similares.

¿Por qué debe importarte?

Piensa en esto: si tu contenido no ofrece algo nuevo, si es muy parecido al que tienen otros sitios webs, ¿Por qué Google debería clasificarlo por encima de ellos?

Eso no quiere decir que serás penalizado, significa que el camino hacia la cima del posicionamiento seo en los resultados de búsqueda será más difícil.

Existen otros motivos importantes:

  1. Mejoras la experiencia de usuario.
  2. Concentras toda la fuerza de los enlaces entrantes en una sola URL en vez de tenerla diluida entre las páginas duplicadas.
  3. Le indicas a Google cuál versión debe incluir y cuáles debe excluir de sus resultados de búsqueda.
  4. Le ahorras tiempo de rastreo innecesario a los motores de búsqueda.

Ejemplos

Los ejemplos de contenido duplicado más comunes, y tal vez los más sencillos de entender son:

Categorías y etiquetas

ejemplo de contenido duplicado en las categorías y las etiquetas de un sitio web. Se ve el mismo extracto de un artículo publicado.
Contenido duplicado entre Categorías y etiquetas

Es muy común que publiques un artículo y le asignes una categoría X y una etiqueta Y (o varias).

Si ingresas a la categoría y a la etiqueta que le has asignado, vas a encontrar exactamente el mismo extracto del artículo que has publicado. Entonces, cuando Google rastree ambas páginas identificará que tienen el mismo contenido.

Página de inicio con múltiples URLs

ejemplo de una página de inicio con multiples URLs que dirigen hacia ella, porque no tiene ninguna canónica.
Página de inicio con variaciones de URLs

Aquí se da el caso del Concepto#1 que te he explicado; tu y Google pueden acceder a la página de inicio desde diferentes URLs.

Parámetros en las URLs

ejemplo de parámetros de URLs tras añadir un filtro en un ecommerce
Se añaden nuevos parámetros en la URL cada vez que se aplica un filtro

Los parámetros son caracteres adicionales que se añaden automáticamente a tu URL cuando se realiza una búsqueda interna en tu web o se filtra la información.

Cada filtro genera nuevos caracteres, traduciéndose en una nueva URL que será interpretada como contenido duplicado.

Publicaciones similares

Si tienes varias publicaciones que hablan sobre temas muy similares o sobre un mismo tema de manera muy similar, Google podría confundirse he interpretarlas como duplicación de contenido.

Otra web roba tu contenido

Sí, es posible que otra web copie tu contenido, lo publique y Google interprete que tú has sido el ladrón. Abundo más sobre este tema en la sección de preguntas frecuentes de este artículo.

¿Es obligatorio solucionar los problemas de contenido duplicado?

Según Google <<el contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda>>.

En otras palabras, solo serás penalizado por Google si él interpreta que estás utilizando el contenido duplicado para engañarlo y obtener mejores posiciones en los resultados de búsqueda.

Además, <<si tu sitio tiene problemas relacionados con contenido duplicado y no sigues los consejos [que te daré más adelante], conocemos muy bien la manera de elegir la versión [URL] adecuada para mostrarla en los resultados de búsqueda>>.

¿Cómo solucionarlo?

Las soluciones más comunes para el contenido duplicado se basan en una de estas acciones:

  1. Si tienes un grupo de URLs que dirigen hacia el mismo contenido, el objetivo será hacerle entender a Google que debe concentrase en la principal e ignorar las demás.
  2. Si tienes un grupo de páginas con contenido muy similar, el objetivo será el mismo.
  3. Si la duplicación se produce entre tu sitio web y otro, tu objetivo será hacerle entender cuál de los dos es el dueño del contenido original.

Vamos a partir del siguiente ejemplo: tienes tres páginas con contenido muy similar; página A, B y C. Tu interés es que Google se concentre en la página A y entienda que las demás son duplicadas.

Veamos.

Redirección

Una redirección, como lo dice su nombre, redirige a los usuarios que intentan acceder a una página X hacia otra página Y, de manera automática.

En este caso, la solución sería aplicar una redirección desde las páginas B y C hacia la página A.

De ese modo, cuando los usuarios intenten ingresar a la página B o a la C, serán redirigidos a la página A como si las demás no existieran.

Y más importante aun, los motores de búsqueda también serán redirigidos hacia la página A cuando intenten ingresar a B o C, traduciéndose esto en la desaparición de ese contenido duplicado.

Metaetiqueta “noindex”

Es un fragmento de código que se utiliza <<para impedir que los rastreadores web de la mayoría de los motores de búsqueda indexen una página de tu sitio web>>.

En otras palabras no tan técnicas, le dice a Google que elimine una página de sus resultados de búsqueda.

En este caso, debes colocar esta metaetiqueta en las páginas B y C. Como la página A será la única que quedaría disponible para aparecer en los resultados, por defecto sería “la original”.

¿Cómo se implementa la metaetiqueta “noindex”?

Aunque hay múltiples formas de hacerlo, existen dos maneras sencillas:

1. Si sabes manejar el código HTML.

Solo debes insertar el fragmento de código entre las etiquetas <head> </head> de cada una de las páginas que deseas desindexar.

Código: <meta name="robots" content="noindex">

2. Si tu web está alojada en wordpress y usas el plugin Yoast SEO, sigue los pasos:

  1. Ve al modo de edición de cada una de las páginas.
  2. Baja hasta la sección del plugin.
  3. Haz clic en el icono del engranaje.
  4. Haz clic en ¿Permitir a los motores de búsqueda mostrar esta entrada en los resultados?
  5. Selecciona “no”.

aplicar la metaetiqueta noindex con el plugin wordpress yoast seo paso a paso

Ahora debes esperar a que los bots de Google rastreen esas páginas, lean la metaetiqueta y las eliminen de sus resultados.

Unir o ampliar el contenido

Como el problema de este ejemplo es que las tres páginas muestran contenidos muy similares, una solución no tan técnica sería tomar los contenidos de B y C para colocarlos en A, de forma coherente. ¡Unir los tres contenidos en una sola página!

Otra solución podría ser ampliar los contenidos de las tres páginas para hacerlos diferentes entre sí.

Metaetiqueta Canónical

Es un fragmento de código que le indica a Google cuál es la URL más importante dentro de un grupo de URLs duplicadas.

URL Canónica: Es la URL más importante entre un grupo de URLs que dirigen hacia una misma página o hacia contenido muy similar.

Al especificar la URL canónica le indicas a Google en cuál debe concentrarse y cuáles debe ignorar (las duplicadas).

Si tu no la especificas <<Google lo hará por ti>>, aunque esto no es recomendable 100%, ya que <<quizá considere que todos tienen la misma importancia, lo que podría generar un comportamiento no deseado>>.

Incluso, aunque la especifiques, es posible que ignore tu decisión y marque como canónica otra URL que considere más importante.

<<No puedes obligar a Google a elegir como canónica la versión que quieras de una página, pero sí puedes influir en su decisión>> utilizando las técnicas que te estoy dando.

¿Cómo especificar una URL canónica?

Igual que la metaetiqueta “noindex” anterior, hay dos maneras sencillas de especificar la URL canónica.

1.  Si sabes manejar el código HTML.

Debes insertar el fragmento de código entre las etiquetas <head> </head> de cada una de las páginas duplicadas.

Importante: Todas las páginas duplicadas deben tener la metaetiqueta canonical con un enlace que apunte a la original.

Código: <link rel="canonical" href="insertar el enlace de la URL original aquí"/>

2. Si tu web está alojada en wordpress y utilizas el plugin yoast SEO.

No tienes que hacer algo al respecto, el plugin genera la canonical de forma automática, apuntando hacia la URL de cada página que has creado.

Pero si por alguna razón quieres que una página apunte su canonical hacia otra URL:

  1. Ve al modo de edición de cada una de las páginas.
  2. Baja hasta la sección del plugin.
  3. Haz clic en el icono del engranaje.
  4. Escribe la nueva URL en la sección canonical.

aplicar la metaetiqueta canónica con el plugin wordpress yoast seo paso a paso

Ahora debes esperar que los bots de Google rastreen las páginas que has indicado y asigne la canonical, si considera que tu petición es correcta.

Insertar enlace de referencia

Si publicas un artículo de tu blog en otra web, es buena practica para que ninguna sea perjudicada por contenido duplicado, colocar en el contenido un enlace que apunte hacia la web autora.

Insertar una metaetiqueta canonical es lo más recomendable, pero no siempre es posible, ya que no sueles tener acceso a las configuraciones del otro sitio.

En cuanto a tomar porciones del contenido de otra web y publicarlo en la tuya, Matt Cutts dice que <<incluir citas, un pequeño extracto o un párrafo, seguido de tu opinión al respecto no genera penalización por contenido duplicado>> y que <<también es recomendable incluir un enlace hacia la fuente>>.

Sitemap

Un sitemap es un listado que le envías a Google con todas las URLs “originales” de tu web, o como lo define el propio Google <<son una forma sencilla de determinar las páginas canónicas de una web grande>>.

Incluir tu URL canónica en él, le dará a Google una señal muy potente al momento de decidirse por una duplicada o por la que has incluido.

Matt Cutts señala que <<si Google ve una URL en la lista de un sitemap y luego ve otra versión [duplicada] de esa URL que no está en él, preferirá la que si está>>.

¿Cómo detectarlo?

Ahora que ya sabes cómo solucionar los posibles problemas de contenido duplicado que presente tu web, solo te falta detectar páginas duplicadas y ponerte manos a la obra.

Screaming Frog es de las mejores herramientas de detección de contenido duplicado, y es muy probable que su versión gratuita te funcione.

Sigue los pasos:

  1. Escribe el dominio de tu web y presiona enter
  2. Espera a que se complete el rastreo
  3. Haz clic en la pestaña URL
  4. Clic en el filtro duplicate

detectar contenido duplicado con la herramienta screaming frog paso a paso

Aparecerá un listado con todas las URLs que tienen problemas de duplicación de contenido. Bastará con que detectes los grupos —la canonical y sus duplicadas— y apliques los ajustes de lugar.

listado de URL duplicadas arrojadas por screaming frog
Listado de URLs duplicadas

Nota que cada URL del listado tiene una versión duplicada con index.html; la duplicada de /cartas es /cartas/index.html. ¿Sabes cuál es la solución para este problema?, déjame la respuesta en un comentario.

Preguntas Frecuentes

preguntas frecuentes sobre redirecciones 301 y 302

¿Tomar un párrafo o una cita de otra web genera problemas de contenido duplicado?

Matt Cutts dice que <<Incluir citas, un pequeño extracto o un párrafo, seguido de tu opinión al respecto no genera penalización por contenido duplicado>>.

¿Es posible que otra web copie mi contenido y Google termine creyendo que yo he sido el ladrón?

Lamentablemente sí.

Te pongo un ejemplo: supón que Google rastrea la web ladrona cada 7 dias y la tuya cada 30.

Si publicas un contenido ahora y la otra web lo copia y lo publica inmediatamente, Google rastreará primero el sitio que te ha hurtado. Luego de 30 días pasará por el tuyo, pero como ya tiene registrado ese contenido, creerá que has sido tú quien lo ha copiado. Un caso triste, pero cierto.

Por fortuna Matt Cutts sugiere una solución. Básicamente consiste en distribuir el contenido recién publicado en las redes sociales, ya que Google sigue esos enlaces más deprisa antes de rastrear el sitio que ha copiado tu contenido.

Además, si alguien roba tu contenido puedes hacer una denuncia por infracción de tus derechos de autor.

¿Cómo puedo evitar contenido duplicado si quiero publicar el mismo artículo en un sitio web como LinkedIn, Medium o Quora?

Lo más recomendable es que el sitio web donde re-publicas tu artículo inserte una metaetiqueta canonical que apunte hacia tu post original, pero como eso no siempre es posible, debes insertar en el contenido, un enlace que apunte hacia tu post original.

¿Cómo evitar el contenido duplicado en un sitio de películas, canciones o recetas?

Replanteo la pregunta. ¿Cómo puedes ser original con un sitio que “está condenado” a tener el mismo contenido que sus competidores?

La importancia de ser original va más allá del contenido duplicado, el problema es que si ofreces lo mismo que tu competencia, ¿por qué Google debería clasificarte en mejores posiciones que ellos?, pero bien, volvamos al tema.

En teoría, todas los sitios de películas deben tener la misma sinopsis, el mismo reparto, la misma imagen, el mismo trailer, etc…

Entonces, ¿Se puede ser original?, sí.

Añade más contenido: más imágenes, más videos, la biografía del director, una opinión personal sobre la película, un análisis de la crítica, entre otras cosas que aporten valor a los usuarios y te diferencien del montón.

¿Cómo evitar contenido duplicado en una tienda online donde los productos son prácticamente iguales y solo cambia ligeramente la descripción y la foto?

Una opción es no indexar los productos e intentar posicionarte por categorías.

Un ejemplo exagerado para que lo comprendas mejor: la categoría sería mochila y los productos mochila Amochila B, mochila C, etc.

Referencias

También te puede interesar: