2

Cómo crear tu sitemap, gestionarlo y resolver problemas

Ilustración de un mapa

 

Ya sabrás que un sitemap, o mapa del sitio, es un archivo donde incluir todas las páginas que componen tu web para que los buscadores sepan cómo has organizado y estructurado el contenido. De este modo, las arañas que utilizan estos motores de búsqueda para rastrear tu sitio pueden usar el archivo para entenderlo mejor y detectar el máximo contenido posible.

 

Tendrás especial necesidad de contar con un buen sitemap si tu web:

  • tiene un gran número de páginas distintas. Por ejemplo, si es una tienda online con una página específica para cada producto. Así Google no se dejará atrás las páginas nuevas o las que has actualizado más recientemente.
  • tiene muchas páginas que están aisladas o que no están correctamente vinculadas entre sí. Igual que antes, Google no se dejará ninguna sin rastrear.
  • es nueva y no hay muchas webs externas que la hayan enlazado todavía. Google y otros rastreadores utilizan los enlaces que se crean de un sitio a otro para arañar toda la red. Si tu sitio aún no cuenta con muchos enlaces externos, el sitemap es la solución a tus problemas.

Cómo crear tu sitemap

Para crear el sitemap de tu web tienes muchas opciones. Lo habitual es generar un archivo en formato XML. Algunos consejos para crear un sitemap en XML que Google pueda rastrear fácilmente son:

  • Incluye esta declaración de espacio de nombres XML en el archivo que generes: xmlns= http://www.sitemaps.org/schemas/sitemap/0.9. Sirve para indicarle a Google el tipo de información que va incluida en el sitemap y las etiquetas que vas a utilizar para describirlo.
  • Sé coherente a lo largo de todo el archivo, es decir, si introduces tu página principal como http://www.ejemplo.com/, después no incluyas URL como http://ejemplo.com/.
  • Si hay alguna página que esté traducida, indícaselo a Google para que lo tenga en cuenta, utilizando anotaciones hreflang.
  • Si el sitemap resultante es muy grande (más de 50.000 URL o de 50 MB sin comprimir), es mejor que lo dividas en varios sitemaps más pequeños: así no pondrás a prueba los recursos de tu hosting al tener que servir un archivo enorme a los buscadores cada vez que quieran rastrearlo. Crea un índice de sitemaps y envíalo a Google para que lo tenga en cuenta, en lugar de enviar cada sitemap por separado.

Si tienes un sitemap en el que quieres incluir información más detallada (además de la información básica sobre las distintas URL), puedes incluir datos sobre vídeos, imágenes, móviles y noticias (aunque Google recomienda que estas últimas, si son muchas, se incluyan en un sitemap específico, ya que se rastreará con más frecuencia).

 

Solo tienes que identificar cada uno de esos contenidos con el espacio de nombre adecuado, para que Google sepa qué tipo de sitemap va a leer y qué tipo de etiquetas va a contener:

  • Imágenes: xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″
  • Vídeos: xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″
  • Móviles: xmlns:mobile=”http://www.google.com/schemas/sitemap-mobile/1.0″
  • Noticias: xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″.

Centrándonos en los sitemaps más comunes, que son aquellos en los que se incluyen únicamente direcciones URL, estas son las 3 etiquetas que debes añadir de forma obligatoria:

  • <urlset> — Informa sobre todas las URL incluidas en el sitemap.
  • <url> — Informa sobre una URL específica.
  • <loc> — Para indicar la URL en sí, es decir, la página de destino.

Estas otras etiquetas son opcionales:

  • <lastmod> — Es la fecha de última actualización de esa URL y debe añadirse con el siguiente formato: aaaa-mm-dd. Puedes añadir la hora, pero es opcional.
  • <changefreq> — Indica la frecuencia con la que se realizan actualizaciones en esa URL, utilizando estos valores: always, hourly, daily, weekly, monthly, yearly, never.
  • <priority> — Indica la prioridad de una página sobre el resto (con valores de entre 1,0 si es muy importante y 0,1 si no lo es).

Aquí tienes un ejemplo de un sitemap.xml muy pequeñito, de solamente dos URL:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.ejemplo.com/pagina.html</loc>

<lastmod>2011-07-24T19:28:12+00:00</lastmod>

</url>

<url>

<loc>http://www.ejemplo.com/carpeta/pagina2.html</loc>

<lastmod>2015-07-20</lastmod>

</url>

</urlset>

 

Si tu sitemap va a ser una cosita básica y sencillita, también puedes crear un simple archivo de texto con extensión TXT (sitemap.txt) que esté situado en el directorio raíz y contenga una URL en cada línea:

http://www.ejemplo.com/pagina1.html
http:// www.ejemplo.com /pagina2.html
http:// www.ejemplo.com/pagina3.html

Cómo enviar tu sitemap a Google

Cuando termines, puedes enviar el sitemap a Google o añadir esta línea a tu archivo robots.txt, en caso de que tengas uno (en cualquier parte del archivo, da igual):

Sitemap: http://www.ejemplo.com/ubicacion_sitemap.xml

 

Si quieres enviar tu sitemap a Google, tendrás que iniciar sesión en Google Search Console (antiguamente conocida como Herramientas para Webmasters de Google):

  • Inicia sesión con tu cuenta de Google en Search Console.
  • Haz clic en el sitio web cuyo sitemap quieres gestionar.
  • Haz clic en “Rastrear” (menú izquierdo) y, después, en “Sitemaps” (lista del menú de rastreo).
  • Haz clic en “Añadir o probar sitemap”.
  • Introduce la URL correspondiente para que Google conozca la ubicación del sitemap y haz clic en “Enviar”.

Actualiza el navegador para que el nuevo sitemap aparezca en la lista. Cuando lo veas, haz clic en él para abrir la página “Detalles del sitemap” y comprobar que no haya errores o advertencias. Como Google puede tardar un poco en completar el procesamiento y revelar todos los errores, es mejor que vuelvas a comprobarlo también al día siguiente.

Cómo gestionar tu sitemap

Si utilizas Search Console, podrás consultar la página “Sitemaps” para ver un resumen de los datos que ha obtenido Google a partir de tu sitemap: formato, número de URL que incluye, número de URL indexadas por Google, fecha de envío del sitemap a Google, fecha de procesamiento por parte de Google, etc. Además, si hay algún problema o error, también constará una advertencia.

 

Para acceder a todos los detalles sobre tu sitemap:

  • Inicia sesión con tu cuenta de Google en Search Console.
  • Haz clic en el sitio web cuyo sitemap quieres gestionar.
  • Haz clic en “Rastrear” (menú izquierdo) y, después, en “Sitemaps” (lista del menú de rastreo).
  • En tu lista de sitemaps, haz clic en el que te interesa para abrir la página “Detalles del sitemap” y ahí tendrás toda la información sobre errores, estadísticas, etc.

Cómo reenviar tu sitemap

Si en algún momento necesitas realizar cambios o mejoras en tu sitemap, podrás simplemente guardarlo y volverlo a enviar siguiendo las instrucciones que te indicábamos más arriba: Search Console >> Rastrear >> Sitemaps. Selecciona el sitemap que quieres reenviar y haz clic en “Volver a enviar sitemap”.

 

Ten en cuenta que Google puede retrasarse un poco (hasta un día) con el procesado del nuevo sitemap, así que ten paciencia y no te pongas nervioso si ves que no desaparece el estado de advertencia.

Cómo solucionar problemas habituales

Si en la página con toda la información sobre tu sitemap ves alguna advertencia, tendrás que revisar tu archivo para mejorarlo y volver a enviarlo como te indicábamos más arriba. ¿Cuáles son algunos de los errores más graves? Pues aquellos que han impedido que Google pueda acceder al sitemap para rastrearlo. Van acompañados de una crucecita roja, para que no los pases por alto.

 

Algunas causas que pueden impedir al rastreador de Google hacer su trabajo son:

  • Sitemap vacío: Tu sitemap no incluye ninguna URL o bien las URL que contiene no están bien etiquetadas. Debes comprobar que el sitemap no esté vacío y, en caso de que no lo esté, asegurarte de que las etiquetas que has utilizado en tus URL son las correctas.
  • Error de compresión: Google no ha podido descomprimir el sitemap que has comprimido y enviado como .zip (u otro formato) para rastrearlo. Vuelve a comprimirlo y reenvíalo.
  • Error de HTTP: Google se ha encontrado con un error de HTTP al intentar acceder a tu sitemap. Puede que haya sido un error temporal, pero es mejor que te asegures de que la URL que has indicado para el sitemap sea correcta y que éste realmente se encuentre ahí. Después, sube tu sitemap una vez más y reenvíalo.
  • URL no válida: Tu sitemap contiene alguna URL que no es válida, por contener caracteres no admitidos (por ejemplo, comillas) o algún error ortográfico (como htp:// en lugar de http://). Revisa todas las URL que has incluido y comprueba que todo sea correcto. Cuando acabes, sube el sitemap actualizado y reenvíalo.

Hay otros posibles problemas, pero lo más probable es que todo vaya sobre ruedas y no tengas ninguna incidencia. En nuestra experiencia, los sitemaps no suelen dar demasiados quebraderos de cabeza. ¿Y en la tuya?

 

Esperamos que esta guía te sea útil o te haya aclarado alguna duda. Si te podemos ayudar con alguna otra pregunta, deja un comentario y lo intentaremos. ¡Gracias por leer!

Andrea Barreiro

Andrea Barreiro

Andrea trabaja en Host Europe desde 2012. Es parte del equipo de marketing y supervisa la actividad en redes, el blog, actualiza la web, gestiona el email marketing y desarrolla otras iniciativas con nuestros clientes.

More Posts

Comentarios sobre "Cómo crear tu sitemap, gestionarlo y resolver problemas"

  1. Juanes Villamar

    Como puedo generar esa fecha si la que me genera mysql no tiene la T ni el signo de + necesito saber como puedo hacer eso ya que con la que me genera mysql el sitemap me esta dando error de fecha.

    Responder
    1. Beatriz CorchadoBeatriz Corchado

      Hola Juanes,

      para que el sitemap esté con el formato correcto, la fecha de última modificación debe encontrarse en formato Fecha y hora de W3C (https://www.w3.org/TR/NOTE-datetime). No hace falta que lleve hora y se puede utilizar solo la parte YYYY-MM-DD.

      Normalmente la fecha y hora que puedes sacar de MySQL no tiene ese formato, para lo cual habría que componerla de forma correcta, por ejemplo:

      ——————————————
      $lastmod = ‘2016-11-22 14:12:17’; // Fecha en formato MySQL
      $datetime = new DateTime($lastmod);
      $result = $datetime->format(‘Y-m-d\TH:i:sP’);
      echo $result; //2016-11-22T14:12:17+01:00
      ——————————————

      Para esta última parte cualquier programador de PHP te podrá ser de más ayuda, porque es algo relativamente sencillo.

      En resumen, yo no me complicaría, y me quedaría solo con la fecha y descartaría la hora. Es más que suficiente.

      Si tienes cualquier otra pregunta, solo tienes que volver a escribirnos.

      ¡Muchas gracias por leernos! ¡Saludos! :)

      Responder

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *