Como Usar La Etiqueta META robots

Escrito por el oct 25, 2012 en paginas web | 0 comentarios

Hoy voy a hablar de una metaetiqueta que considero muy importante en una página web, la metaetiqueta “robots”.

 

Como utilizar la etiqueta META robots

Personalmente en mis páginas suelo utilizar normalmente para esta metaetiqueta los valores “Index / Follow” a no ser que haya alguna página en concreto que no desee que se indexe. En este caso o bien podemos informar a los buscadores a través de la metaetiqueta en la propia página o utilizar otra opción que yo la utilizo en todas las instalaciones que es hacer uso del archivo robots.txt para informar de qué páginas, o carpetas no deseo que me indexen los buscadores, o incluso puedes definir el nombre del buscador concreto.

Las metaetiquetas siempre las definiremos en el bloque “head” de nuestra web. En este post únicamente estamos hablando de la metaetiqueta “robots”.

Index: que se indexe la página
Follow: que se sigan los enlaces que contiene la página
Noindex : impide la indexación de la página
Nofollow: impide que se sigan los enlaces que aparecen en la página

Dicha metaetiqueta aparte de estos valores anteriormente comentados tiene una serie de valores con otras funciones. Algunos de ellos son:

Noarchive: no se muestra la página en la cache de Google
Noimageindex: Muy útil si no deseas que tus imágenes aparezcan indexadas
Noodp: no se puede utilizar la descripción alternativa de DMOZ
Nosnippet: impide que en los resultados del buscador aparezca una descripción de la página. Únicamente aparecerá el título

También es muy común utilizar el valor “all” para indicar que se indexen todas las páginas.

Si no se informa específicamente de los valores restrictivos, por defecto los buscadores usaran index, archive, snippet, follow, odp, etc.

Una vez dada la introducción, aunque imagino que casi todo el mundo sabe el uso de esta metaetiqueta voy a publicar una recomendación. Hay que evitar el uso del  valor “No Index / Follow” en la metaetiqueta “robots” en vuestras páginas ya que le estás diciendo a los buscadores que sigan mirando los enlaces vinculados pero que no hagan caso de la página en si, lo cuál puede levantar ciertas sospechas por lo menos en lo que a calidad de contenidos se refiere. Lo mismo digo para el caso inverso, es decir, “Index / No Follow”. Estamos diciendo mira qué contenido que tengo pero no hagas ni caso a los enlaces que aparecen en dicho contenido. Si lo haces una vez no pasa nada, pero si lo utilizas constantemente estas acciones pueden levantar sospechas.

Y lo que he comentado al principio es el uso del fichero robots.txt en la instalación. Es muy útil y en él podemos informar de los buscadores que queremos que entren, de las carpetas que no deseamos sean indexadas, podemos informar incluso del sitemap que tengamos configurado en nuestra página web, etc.

Un ejemplo:

User-agent: * (todos los buscadores pueden acceder)
Allow: / (por defecto permito acceso a todas las carpetas)
Disallow: /a (no deseo que se indexe la carpeta a)
Sitemap: http://www.tusitio.com/sitemap.xml (ubicación y nombre del sitemap)

Espero que te haya gustado el post.

Be Sociable, Share!

Deje una respuesta.

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>