Como funcionan los nofollow
Cómo Google indexa los enlaces en casos de follow y nofollow
En este experimento va a desentrañar algunas dudas de cómo Google indexa los enlaces con el atributo rel en follow y nofollow.
Base teórica
Hace algún tiempo que Google se dio cuenta de una práctica muy común de algunos usuarios de Internet que se dedicaban a dejar comentarios en los blogs con su correspondiente enlace hacia su página web. Esta práctica se llevaba a cabo con la finalidad de aumentar la importancia de la página enlazada ya que Google considera un enlace a una página web como un voto a favor. Este tipo de comentarios son considerados spam para Google, es por ello que idearon un nuevo atributo para los enlaces, el atributo rel. La sintáxis del atributo rel es muy simple:
<a href=”x.php” rel=”nofollow”></a>
De esta manera todos aquellos enlaces que tienen el atributo rel=”nofollow” no suponene un voto negativo o desfaborable para la página web destino, pero tampoco suponen un voto a favor. De esta manera es como Google intenta evitar este tipo de prácticas con las que no está nada de acuerdo.
Así que hizo público este nuevo atributo en su blog con la esperanza de los desarrolladores de software hizieran uso de él: Prevenir los comentarios spam. Y se puede decir que así ha sido.
Por otra parte este atributo ha abierto nuevos caminos a explotar por la comunidad SEO, tal y como ya he explicado en algún que otro artículo dentro de este blog (Optimización de enlaces posicionamiento), pero también muchas dudas.
Escenario

Tal y como se muestra en la figura para realizar este experimento se precisan 3 páginas y 4 enlaces. Los 4 enlaces tienen un texto de enlace o “anchor text” distinto y único. Además, para facilitar la lectura de los resultados, en el momento de realizar el experimento se comprueba que las palabras que forman los textos de enlace no están presentes en las páginas indexadas por Google. Para ello nos inventamos 4 palabras (o más bien conjunto de letras) y se buscan en Google, si no aparece ningún resultado, las consideramos como válidas para el experimento.
A continuación se construye una página con un poco de texto, pero sobretodo no se incluye en él ninguna de las palabras clave . Esta página es enlazada por dos páginas más:
La página 1 que consta de dos enlaces con dos textos de enlace distintos. Los dos enlaces de esta página tienen el atributo rel como follow.
La página 2 que también consta de dos enlaces con dos textos de enlace distintos entre sí y distintos a los de la página 1. El primer enlace contiene el atributo rel como nofollow y el segundo enlace contiene el atributo rel como follow.
Evaluación
Después de un tiempo prudencial para que Google indexe todas las páginas del experimento se comprueban los resultados. La evaluación es simple, solamente se trata de poner en el buscador las palabras clave inventadas que forman los enlaces. Los resultados que se han obtenido el día 6/11/2008 han sido los siguientes:
Texto de enlace 1: página 1, enlace 1º, atributo rel follow.

Texto de enlace 2: página 1, enlace 2º. atributo rel follow.

Texto de enlace 3: página 2, enlace 1º, atributo rel nofollow.

Texto de enlace 4: pagina 2, enlace 2º, rel follow.

Conclusiones
Observando los resultados se puede ver que sólo se ha indexado la página 3.php en un caso: en la primera palabra clave. El resultado obtendio sobre las palabras clave de la 1ª página (1.php) era de esperar ya que el escenario es exactamente el mismo que en un experimento anterior: Resolviendo dudas sobre el orden de los enlaces y Google. La conclusión fue que ante dos palabras clave igual de descriptivas Google se ha quedado con la primera.
Ahora lo que sí que es sorprendente es el resultado de los enlaces de la 2ª página (2.php). ¡La 3ª página no se ha indexado!
Una posible conclusión de esto sería que si hay un enlace hacia una página con el atributo nofollow, los enlaces posteriores a la misma página no se indexan a pesar de no tener el atributo nofollow. Si esto es cierto me parece a mi que tengo un problema en algunas optimizaciones que he realizado ya que en algunos casos he puesto el atributo nofollow a enlaces porqué no me interesaba el anchor text y luego he puesto un enlace con el anchor text adecuado a la misma página. Sin embargo me cuesta creer esta primera conclusión ya que mi experiencia me dice que la práctica que uso me funciona muy bien, ya que el algoritmo de Google siempre ha entendido lo que le quería decir. Así que me conclusión presonal es que Google de nuevo se ha quedado con el primer enlace ya que el segundo tampoco le aportaba mucho más. Si el anchor text del segundo enlace hubiera destacado en algo, es decir, hubiera formado parte de la 3ª página o hubiera sido una palabra importante dentro de la misma página 2.php, ésta hubiera cobrado relevancia y por tanto sí que el algoritmo de Google la hubiera tenido en cuenta.
Aquí se me plantea otra duda, y es que estas conclusiones son exclusivamente para lo que Google llama concordancia de hipertexto, pero ¿y el PageRank? ¿Cómo puedo saber si el segundo enlace está pasando PageRank a la página 3.php? Desde luego en este experimento no lo sabré nunca.
Sin embargo estamos en lo mismo de siempre, esto son sólo especulaciones. Así que me encataría que si tienes algo que revatir, si tienes una nueva teoría sobre el tema no te cortes y cuéntanosla aquí
Replanteamiento
¿Y si el atributo rel=”nofollow” estuviera en la segunda posición? Añado una nueva página al experimento:

El resultado es el siguiente, para el enlace con el texto de enlace 5 que tenía el atributo rel a follow se han indexado las dos páginas.
Como era de esperar la palabra clave del texto 6 sólo no se ha indexado para la página 3.

Conclusiones del replanteamiento
En fin, a ver si al final habrá que vigilar mucho con el orden. El caso es que en este experimento si el primer enlace tiene el atributo nofollow los siguientes enlaces a la misma url dejan de ser valorados. Esta es la conclusión.
[Experimento 0: Como funcionan los nofollow]
