S.E.O.: evitando contenido duplicado para buscadores

Pues eso, que llevaba unos días dándole vueltas a cómo evitar el contenido duplicado para Google, que coje como rutas distintas las siguientes:

Total, cuatro URL diferentes para un mismo contenido, y los buscadores, pese a lo avanzado de su logaritmo, no entienden que se trata de la misma y lo penalizan. Y esto no es nada, ya que en páginas dinámicas el número de rutas por las que se puede llegar a un mismo contenido es mucho más abundante (por categoría, por nube de tags, buscando, etc.) y hay que tener unos conocimientos medios para evitarlo.

SEO: Google y el contenido duplicado

SEO: Google y el contenido duplicado

Buscando soluciones he encontrado varias:

  1. Lo más simple es añadir la siguiente metatags <link rel=”canonical” href=”www.misitio.com” /> en todas las páginas que tengan un contenido igual o muy similar al de la raíz del sitio, diciéndole a Google que se trata de la misma página (o muy parecida) e indicándole cual es la importante (en este caso el archivo que se carga por defecto en el dominio). La amenaza de penalización por contenido duplicado se elimina.
  2. Pero he aquí que puede que el page rank de http://www.misitio.com y http://www.misitio.com/index sea diferente. Si quieres que el resultado de ambos se sume (y no como en el caso anterior en el que sólo se priorizaba uno) aunque no sea de forma aritmética, una solución es tocar el archivo .htaccess , que va en la raíz de tu sitio y que da indicaciones al servidor acerca de su comportamiento. Pues bien con el siguiente código lo que se consigue es que dé igual si alguien escribe (o un enlace te lleva a): http://www.misitio.com, http://www.misitio.com/index, misitio.com ó misitio.com/index, ya que el servidor siempre mostrará (y Google siempre contará como visita) la URL http://www.misitio.com. El código es el siguiente:

RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} ^misitio\.com$ [NC]
RewriteRule ^(.*)$ http://www.misitio.com/$1 [R=301,L]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.html\ HTTP/
RewriteRule ^index\.html$ http://www.misitio.com/ [R=301,L]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/
RewriteRule ^index\.php$ http:///www.misitio.com/ [R=301,L]

El archivo .htaccess (no se os olvide el punto primero, que indica que es un archivo del sistema) para quien no lo sepa va en el directorio raíz del servidor, y se puede crear y manipular con cualquier editor de texto plano (el mismo block de notas).

Subidlo y probadlo, veréis cómo funciona!

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: