Leer cabeceras HTTP y meta etiquetas

¿Está tu sitio bien programado para las arañas? Averigua qué cabeceras devuelven tus páginas.

Muchas veces se programan los sitios Web sin tener en cuenta las cabeceras y los códigos de estado HTTP. Hacemos un test de la web para comprobar que todo se ve correctamente y que el usuario puede entrar en todos los contenidos, pero no queremos darnos cuenta de lo que ven las arañas de los buscadores cuando visitan nuestro sitio web. Efectivamente, primero un sitio web tiene que estar hecho para los humanos, pero también tenemos que facilitar a las arañas su paso y entendimiento de los contenidos.

Por eso es importante conocer qué cabeceras están leyendo. Considero muy importante que si una página no devuelve ningún contenido se lea en la cabecera el código HTTP de error 404 (Página no encontrada). Aunque parezca mentira hay muchos sitios web que devuelven páginas HTTP 200 (OK) y la URL no tiene contenido. Esto pasa mucho con los sitios web dinámicos. Comprueba aquí esta cabecera, entre otras.


    

Códigos de estado HTTP

Los códigos de estado HTTP están especificados en el RFC (Request for Comments) de la organización IETF (The Internet Engineering Task Force) . A continuación vamos a describir algunos de los códigos de estado HTTP, los más comunes, però puedes encontrar el resto en el sitio web del IETF, principlamente en el RFC2616.

  1. 1xx: Respuestas informativas: sólo se usa en condiciones experimentales.
  2. 2xx: Peticiones correctas.
    • 200 OK: es la respuesta estándar.
    • 201 Creado: la respuesta ha sido correcta y además se ha creado un nuevo recurso.
    • 202 Aceptada: la respuesta ha sido recibida y aceptada por el servidor, pero no ha sido procesada.
  3. 3xx: Redirecciones.
    • 301 Movido permanentemente.
    • 302 Movido temporalmente.
    • 303 Vea otra.
  4. 4xx: Errores del lado del cliente.
    • 403 Prohibido: La solicitud és correcta, pero el servidor no va ha responderala.
    • 404 No encontrado: la página no ha sido encontrada.
    • 413 Solicitud demasiado larga
  5. 5xx: Errores del servidor.
    • 500 Error interno: Este error normalmente se dispara cuando se produce algún error en la programación del lado del servidor, como por ejemplo PHP o ASP.