viernes, 25 de diciembre de 2009

Rel="Canonical" - Contenido duplicado y plagiado: Mitos, realidades y diferencias

Cuando uno habla de contenido duplicado, uno espera que se trate de contenido que otros sitios como pasa con la copia de contenido con Taringa, pero la realidad dista mucho de esta situación.

El contenido duplicado para Google sólo se refiere a contenido que está duplicado dentro de tu misma página, un aviso de Copyright muy largo que pongas en cada página o un texto de bienvenida, como la descripción de mi blog que aparezca en todas las páginas, dependiendo del las dimensiones del contenido, pueden ser factores que generen penalizaciones.

Pero la mayoría de estos casos de contenido duplicado se deben a diferentes formas de acceder al mismo contenido de una página:

Por ejemplo para las direcciones que apuntan a la misma página:
http://www.ejemplo.com/productos/mujeres/vestidos
http://www.ejemplo.com/productos?categoría=vestidos&color=verde&cruel=no
http://ejemplo.com/tienda/index.php?id_producto=32&resaltar1...&idaf=431>
http://ejemplo.com/vestidos/coctel?gclid=ABCD
http://www.ejemplo.com/vestidos/vestidoverde.html
Google por sí mismo no crea vínculos o prueba diferentes métodos para entrar a tu web, simplemente un Webmaster o administrador de un sitio agrega vínculos que en la práctica llevan al mismo sitio o página, Google, sus robots pueden interpretar esta información como contenido duplicado, aunque para usted sea la misma página, Google la verá como dos páginas con el mismo contenido y puesto que es el mismo dominio eso puede acarrearle penalizaciones debido a que al principio los SPAMERS usaban este método para tener más contenido del que realmente poseian.

Lo mismo ocurriría con vínculos como
  • http://cgnauta.blogspot.com
  • http://www.cgnauta.blogspot.com/
  • http://cgnauta.blogspot.com/index.html
Es común los vínculos al index, sin embargo para Google no será lo mismo detectar dos vínculos en tu sitio a http://misitio.com y http://misitio.com/index.html

A la jerarquizacion de los vínculos que apuntan o invocan a un mismo sitio o página se le llama Canonicalización.

Un vínculo canónico es la dirección preferida de una página, que se estructura para trabajar con diferentes formas de invocar dicha página, a estas invocaciones les llamamos vínculos no canónicos, pues al pasar por ellos el robot de Google sabrá que todos apuntan a una misma dirección canónica.

Para ello necesitamos usar el atributo  rel="canonical" (no es un atributo estándar, sino de buscadores).

Por ejemplo para estas tres direcciones:
http://www.ejemplo.com/productos/mujeres/vestidos
http://www.ejemplo.com/productos?categoría=vestidos&color=verde
http://www.ejemplo.com/vestidos/vestidoverde.html

Si la página que preferimos es:
http://www.ejemplo.com/vestidos/vestidoverde.html
Tendremos que agregar dentro de la etiqueta <head></head>
<link rel="canonical" href="http://www.ejemplo.com/vestidos/vestidoverde.html">
Esto indicará al robot que siga un vínculo no canónico la página preferida y dirá que el vínculo lleva a la misma página.

Tambien se aceptan en modo relativo:
<link rel="canonical" href="vestidos/vestidoverde.html">
Por supuesto es mucho mejor cuidar la jerarquía de nuestros sitios desde un principio y evitar aquellos formatos de vinculos internos que de diferentes formas apunten a la misma dirección, podremos implementar métodos en sitios dinámicos para que sean tratadas las páginas como direcciones fijas y redirecciones 301 respectivas para indicar a Google la dirección real o preferida de una página.

Google tienen una página sobre el contenido duplicado.

rel="canonical" no es tan sencilla de implementar en todos los sitios y es más complicado en sitios con mucho contenido estáticos y dinámicos que requieran de muchos cámbios al código para implementarlo por condicionanles.

Google tienen una página sobre la implementación del atributo canonical.

Tampoco tenemos especificaciones exactas del atributo y no sabemos si en el futuro Google decida modificar sus funcionamiento como ocurrió con nofollow.

En el caso de Blogger, podremos ver que está implementado por defecto, si usamos un vinculo www.ejemplo.com/index.html y ejemplo.com en uno o varios vínculos desde páginas externas o internas Google siempre sabra la dirección correcta de la página.

Contenido plagiado y publicado (sin créditos al autor)
En internet el contenido fluye libremente no podemos evitarlo, desde esta perspectiva poco podemos hacer, pero es justo pedir un enlace, más cuando no afecta al Pagerank de quien enlaza, pero poco podemos hacer contra el plagio.

Del lado de Google se pide a los webmasters o administradores de una web que se enfoquen en crear un sitio de calidad según sus directrices.

Según Google el contenido duplicado externo no te afecta, aún si un sitio finalmente aparezca primero que tú cuando se posiciona mejor en los resultados, algunos sitios como Taringa se basa en la copia masiva de artículos, que no benefician al autor aunque pongan el vínculo, pues usan el atributo nofollow.

No puedes denunciar contenido duplicado en el sentido de plagio a Google
A Google no le interesa que te plagien, es realmente triste que al autor de un contenido lo manden hasta las últimas páginas de resultados o peor aún en resultados omitidos.

Sólo puedes presentar una reclamación bajo la DMCA a Google. Tienes que enviarles un fax o una carta, no puedes enviar un correo, generalmente para contenido impreso de un libro u otro material del estilo.

La página de reporte de SPAM que pueden acceder desde aquí, no sirve para paginas plagiadas por otros sitios, cuando se refiere a páginas duplicadas es a la cuestión de vínculos canónicos exclusivamente.

En el caso de agregadores es prioritario firmar sus Feeds con vínculos o remarcando el nombre del autor y el sitio, no me refiero con ello a agregar a cada articulo un vinculo o firma, los feed permiten agregar información adicional, Blogger por ejemplo en Configuración - Feed del sitio, permite poner una firma..


En palabras de Google:
Si cree que el contenido se debe eliminar por otra razón, póngase en contacto con el webmaster del sitio en cuestión. Una vez que el webmaster elimine la página o cambie su contenido, nuestros resultados de búsqueda reflejarán automáticamente el cambio la próxima vez que se rastree e indexe el sitio.
Que hacer cuando te copian
Pues debido a que no podemos hacer nada con Google, ponte en contacto con los administradores del sitio que te ha copiado, apela a su corazoncito, porque finalmente Google no se hace responsables de esos problemas.

Como sea Google no penaliza por contenido plagiado y copiado, que nosotros entendemos por duplicado, sino filtra el contenido que considere importante de las copias, algo que desde luego trabaja como si se tratase de una penalización.

Comentarios y Consultas

Los mensajes son moderados serán revisados antes de publicarse.

Este no es un foro de adolescentes, no uses letras en vez de palabras completas como "q" en vez de "que", ni escribas tus mensajes en mayúsculas, se respetuoso con los demás, si no estás de acuerdo no comentes.

Una cosa es que no te guste una crítica, otra que uses un lenguaje inapropiado para demostrarlo. No me siento en la obligación de publicar ningún mensaje en específico o de leerlo entero si usas palabras altisonantes.

Termina la serie Grimgar de Fantasía y Cenizas

Grimgar de Fantasía y Cenizas (2016)Llegó a su fin Grimgar de Fantasía y Cenizas luego de doce episodios.

[Leer artículo...]

One Punch Man OVA 4 (2016): Review y crítica

One Punch Man OVA 4 (2016): Review y críticaY llega una nueva adaptación de personajes del universo marvel, una divertida aventura espacial.

[Leer artículo...]

Gate: Segunda temporada (2016): Episodio 12 Final: Reseña y crítica

Gate: Segunda temporada (2016): Episodio 12 Final: Reseña y críticaLas aventuras de Itami y sus amigos llega a su fin con el rescate de Piña de las manos de Zorzal.

[Leer artículo...]

Desaparecida: Boku Dake ga Inai Machi (2016) Episodio 12 Final - Reseña y crítica del anime

Desaparecida: Boku Dake ga Inai Machi (2016)Satoru descubre al culpable de la trama, es el momento de enfrentarse y tendrá que dar todo de sí para cambiar su suerte.

[Leer artículo...]

  © Cgnauta | CGsign blog | [Ver Licencia de uso] | Matius Lenin, Creative Commons, algunos derechos reservados

Regresar ARRIBA  

Vistas desde Mayo 2009

▼/▲ Archivo del Blog

Visitas totales

Información

IBSN: Internet Blog Serial Number 01-77-94-2008

Esta plantilla es creada y diseñada por Matius Lenin para CGnauta blog. Con Scripts de JQuery bajo licencia GNU/GPL. CGnauta es una marca registrada propiedad de Matius Lenin.

Anexos

Bitacoras.com