Acerca de los Sitemaps
Como ya hemos platicado antes, los sitemaps son archivos xml que permiten a los motores de busqueda indexar mas facilmente nuestros sitios web, la verdad es, que aunque el tema no es muy complejo la mayoria tenemos aun algunas cosas por aprender acerca de los sitemaps, para esto les traigo los puntos mas importantes acerca de ellos:
¿Que es un sitemap?
Un sitemap es un archivo XML el cual es utilizado por los motores de busqueda para indexar mas facilmente un sitio web, basicamente el archivo contiene una lista con todas las url de un sitio web, el sitio web http://www.sitemaps.org contiene informacion muy importante acerca de los sitemaps y su formato.
¿Como se usan los sitemaps?
Cuando un motor de busqueda esta indexando un sitio web y esncuentra un archivo sitemap, este es usado para ayudar en la indexacion del sitio web, tambien es posible enviar manualmente un sitemap a los motores de busqueda, es posible hacerlo mediante un “ping” y con herramientas como Google Webmaster Tools.
¿Tengo que reenviar mi sitemap cada vez que actualizo mi sitio web?
Los motores de busqueda verificaran tus sitemaps regularmente, sin embargo, si es recomendable reenviar un sitemap despues de actualizar un sitio web.
¿Existe alguna regla sobre el nombre del sitemap?
No, el sitemap se puede nombrar como sea, ni siquiera es necesario que tenga extension xml, sin embargo debes asegurarte de que el tipo de archivo (mime type) sea correcto, debe ser “text/xml”.
Sitemaps y robots.txt
Es posible usar el archivo robots.txt para informar a los motores de busqueda donde se encuentra tu sitemap, simplemente agregaremos una linea extra dentro de nuestro archivo robots.txt como la siguiente:
Sitemap: http://www.example.com/sitemap.xml
Sitemaps y Google
Google cuenta con un servicio llamado Google Webmaster Tools el cual permite dar de alta sitemaps y ademas nos da algunas estadisticas de las paginas enviadas contra las indexadas entre otras cosas.
¿Necesito una cuenta de Google para enviar mis sitemaps?
No necesariamente, sin embargo es muy recomendable el uso de Webmaster Tools, en caso de que no tengas cuenta con Google puedes usar el servicio de ping para enviar un sitemap.
¿Cual es el tamaño maximo de un sitemap en Google?
Un sitemap puede contener hasta 50,000 direcciones o pesar 10 MB, sin embargo es posible dividir tu sitio en varios sitemaps mas pequeños que administren seccion del sitio web.
¿Puedo usar un RSS como sitemap con Google?
Si, Google acepta RSS 2.0 y Atom 0.3 como sitemaps validos, sin embargo la idea de un sitemap es tener todas las paginas de un sitio web y no solo las ultimas 10 o 20.
¿Como puedo saber si un sitemap es correcto?
De nuevo la recomendacion es usar Webmaster Tools, cuando un sitemap es enviado mediante esta herramienta, Google te dira si es que existe algun error con el. Tambien es buena idea usar algun validador de XML para revisar la estructura del sitemap.
Los mensajes de error mas frecuentes son los siguientes:
“This url is not allowed for a sitemap at this location”
Este error indica que tu sitemap contiene url’s no validas para su contexto, es decir, un sitemap solo puede contener url’s dentro del mismo dominio y dentro del mismo directorio(o subdirectorios del directorio), un sitemap ubicado en el directorio raiz podria contener todas las url’s del sitio pero un sitemap dentro de un directorio no podria contener url’s de nivel superior.
“Invalid date”
Este error indica que alguna de tus url’s contiene una fecha de modificaciòn invalida, los sitemaps requiren el uso de fechas en formanto ISO-8601 encoding el cual tiene 2 variantes, aunque para facilitar las cosas yo les recomiendo usar este formato:
2010-02-24 (YYYY-MM-DD)
“We couldn’t find your verification file.”
Cuando ligas un sitio web con Webmaster Tools, Google te pide que verifiques la propiedad del sitio, es importante que mantengas el metodo de verificacion activo para que Google verifique que sigues siendo el propietario del sitio web.
En caso de que aun tengan dudas les dejo estos sitios web de referencia:


