El contenido duplicado para Google sólo se refiere a contenido que está duplicado dentro de tu misma página, un aviso de Copyright muy largo que pongas en cada página o un texto de bienvenida, como la descripción de mi blog que aparezca en todas las páginas, dependiendo del las dimensiones del contenido, pueden ser factores que generen penalizaciones.
Pero la mayoría de estos casos de contenido duplicado se deben a diferentes formas de acceder al mismo contenido de una página:
Por ejemplo para las direcciones que apuntan a la misma página:
http://www.ejemplo.com/productos/mujeres/vestidosGoogle por sí mismo no crea vínculos o prueba diferentes métodos para entrar a tu web, simplemente un Webmaster o administrador de un sitio agrega vínculos que en la práctica llevan al mismo sitio o página, Google, sus robots pueden interpretar esta información como contenido duplicado, aunque para usted sea la misma página, Google la verá como dos páginas con el mismo contenido y puesto que es el mismo dominio eso puede acarrearle penalizaciones debido a que al principio los SPAMERS usaban este método para tener más contenido del que realmente poseian.
http://www.ejemplo.com/productos?categoría=vestidos&color=verde&cruel=no
http://ejemplo.com/tienda/index.php?id_producto=32&resaltar1...&idaf=431>
http://ejemplo.com/vestidos/coctel?gclid=ABCD
http://www.ejemplo.com/vestidos/vestidoverde.html
Lo mismo ocurriría con vínculos como
- http://cgnauta.blogspot.com
- http://www.cgnauta.blogspot.com/
- http://cgnauta.blogspot.com/index.html
A la jerarquizacion de los vínculos que apuntan o invocan a un mismo sitio o página se le llama Canonicalización.
Un vínculo canónico es la dirección preferida de una página, que se estructura para trabajar con diferentes formas de invocar dicha página, a estas invocaciones les llamamos vínculos no canónicos, pues al pasar por ellos el robot de Google sabrá que todos apuntan a una misma dirección canónica.
Para ello necesitamos usar el atributo rel="canonical" (no es un atributo estándar, sino de buscadores).
Por ejemplo para estas tres direcciones:
http://www.ejemplo.com/productos/mujeres/vestidos
http://www.ejemplo.com/productos?categoría=vestidos&color=verde
http://www.ejemplo.com/vestidos/vestidoverde.html
Si la página que preferimos es:
http://www.ejemplo.com/vestidos/vestidoverde.htmlTendremos que agregar dentro de la etiqueta <head></head>
<link rel="canonical" href="http://www.ejemplo.com/vestidos/vestidoverde.html">Esto indicará al robot que siga un vínculo no canónico la página preferida y dirá que el vínculo lleva a la misma página.
Tambien se aceptan en modo relativo:
<link rel="canonical" href="vestidos/vestidoverde.html">Por supuesto es mucho mejor cuidar la jerarquía de nuestros sitios desde un principio y evitar aquellos formatos de vinculos internos que de diferentes formas apunten a la misma dirección, podremos implementar métodos en sitios dinámicos para que sean tratadas las páginas como direcciones fijas y redirecciones 301 respectivas para indicar a Google la dirección real o preferida de una página.
Google tienen una página sobre el contenido duplicado.
rel="canonical" no es tan sencilla de implementar en todos los sitios y es más complicado en sitios con mucho contenido estáticos y dinámicos que requieran de muchos cámbios al código para implementarlo por condicionanles.
Google tienen una página sobre la implementación del atributo canonical.
Tampoco tenemos especificaciones exactas del atributo y no sabemos si en el futuro Google decida modificar sus funcionamiento como ocurrió con nofollow.
En el caso de Blogger, podremos ver que está implementado por defecto, si usamos un vinculo www.ejemplo.com/index.html y ejemplo.com en uno o varios vínculos desde páginas externas o internas Google siempre sabra la dirección correcta de la página.
Contenido plagiado y publicado (sin créditos al autor)
En internet el contenido fluye libremente no podemos evitarlo, desde esta perspectiva poco podemos hacer, pero es justo pedir un enlace, más cuando no afecta al Pagerank de quien enlaza, pero poco podemos hacer contra el plagio.
Del lado de Google se pide a los webmasters o administradores de una web que se enfoquen en crear un sitio de calidad según sus directrices.
Según Google el contenido duplicado externo no te afecta, aún si un sitio finalmente aparezca primero que tú cuando se posiciona mejor en los resultados, algunos sitios como Taringa se basa en la copia masiva de artículos, que no benefician al autor aunque pongan el vínculo, pues usan el atributo nofollow.
No puedes denunciar contenido duplicado en el sentido de plagio a Google
A Google no le interesa que te plagien, es realmente triste que al autor de un contenido lo manden hasta las últimas páginas de resultados o peor aún en resultados omitidos.
Sólo puedes presentar una reclamación bajo la DMCA a Google. Tienes que enviarles un fax o una carta, no puedes enviar un correo, generalmente para contenido impreso de un libro u otro material del estilo.
La página de reporte de SPAM que pueden acceder desde aquí, no sirve para paginas plagiadas por otros sitios, cuando se refiere a páginas duplicadas es a la cuestión de vínculos canónicos exclusivamente.
En el caso de agregadores es prioritario firmar sus Feeds con vínculos o remarcando el nombre del autor y el sitio, no me refiero con ello a agregar a cada articulo un vinculo o firma, los feed permiten agregar información adicional, Blogger por ejemplo en Configuración - Feed del sitio, permite poner una firma..
En palabras de Google:
Si cree que el contenido se debe eliminar por otra razón, póngase en contacto con el webmaster del sitio en cuestión. Una vez que el webmaster elimine la página o cambie su contenido, nuestros resultados de búsqueda reflejarán automáticamente el cambio la próxima vez que se rastree e indexe el sitio.Que hacer cuando te copian
Pues debido a que no podemos hacer nada con Google, ponte en contacto con los administradores del sitio que te ha copiado, apela a su corazoncito, porque finalmente Google no se hace responsables de esos problemas.
Como sea Google no penaliza por contenido plagiado y copiado, que nosotros entendemos por duplicado, sino filtra el contenido que considere importante de las copias, algo que desde luego trabaja como si se tratase de una penalización.
Comentarios y Consultas
Los mensajes serán revisados a veces. No te olvides que soy una persona, no se trata de faltar al respeto, todos tenemos opiniones, no hay que enojarse.
Puedes marcar Notificarme para recibir la notificación de la respuesta.