Soluciones SEO contenidos duplicados
Chema nos ha planteado en este blog sobre un problema con sus urls y como la respuesta iba a ser un poco larga he querido hacer un post. El problema que nos plantea radica en que dentro de su site puede acceder a una misma página web a través de diversas urls debido al paso de parámetros. Por ejemplo: pagina.php es igual que pagina.php?parametro1=1 y esta es igual a pagina.php?parametro2=6, etc. Y es que hay muchos casos en que los programadores pasan parámetros que utilizan ellos internamente, pero que no generan ningún cambio en la página HTML en sí y esto genera grandes problemas de contenido duplicado. Existen muchas maneras de solucionar esto, pero claro, todas ellas dependen de como esté programada la web.
Una manera que se me ocurre es trabajar con los metadatos de la siguiente manera:
if (parametro1!="" || parametro2!="") {
< meta name="robots" content="noindex, follow" >
}
De esta manera le estas indicando a Google que no ponga en su índice esta página, pero sí que siga los enlaces que se encuentre en ella.
Pero la empresa Google es muy consciente de este problema y sabe que muchos webmasters lo tienen, es por ello que hace relativamente poco han sacado una nueva funcionalidad dentro de la herramienta Google Webmaster Tools. Esta funcionalidad te deja ver qué parámetros ha ignorado Google, pero lo mejor es que te permite cambiar esta configuración. Bueno, rectifico más que cambiar sería indicar, señalar, sugerir a Google qué parámetros debería ignorar y que parámetros no debería ignorar. Pásate por la herramienta Google Webmaster Tools >> Información sobre el sitio >> Configuración >> Organización de parámetros y lo verás.






Hola, se aprende mucho por aqui, gracias.
Tengo una duda con la barra -trailing slash- al final de las url, como podria hacer para que si google rastrea la url tipo: blog/2010/01/02algomas (sin el slash) de un error 404?, porque de momento google la toma como duplicada y me está complicando mucho. Algunas reglas de htaccess que he visto aqui no me han funcionado, ej:
# Si no hay barra al final, poner una
RewriteCond %{REQUEST_URI} !(\.[^/]*|/)$
RewriteRule ^(.*[^/])$ /$1/ [R=301,L]
Muchas gracias.
Hola, me alegro que te resulte útil el blog.
Este caso es curioso, no sé si te podré ayudar porqué la verdad es que no he podido hacer pruebas ya que los servidores de los que dispongo ahora mismo lo hacen automáticamente. Es decir, sin el htaccess y poniendo una URL sin la barra final, el servidor ya me redirecciona hacia urls con la barra al final.
Sin embargo puedo sugerirte esta página: http://httpd.apache.org/docs/2.0/misc/rewriteguide.html
Mírate sobretodo la sección URL Layout, creo que te dará alguna pista de lo que no está funcionando.
Si llegas a alguna conclusión y te apetece puedes compartirlo aquí. Nos encantaría.
Nosepo, creo que la solución la tienes aquí:
http://www.posicionapro.com/blog/quitar-la-barra-final-de-las-urls.html
Pero con alguna modificación:
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)[^\/]$ /$1/ [R=301,L]
OJO con las urls que acaban con extensión .php o .html u otra cosa, tendrás que tenerla en cuenta.
Les comento que el problema lo tiene el cms/blog flatpress, que está repleto de problemas seo, el posteado aqui es uno entre tantos. Asi que voy a migrar a otro cms. Y desde luego ya tengo a posicionapro en mis favoritos para poner a punto todo.
Gracias.