La indexación es la base del posicionamiento buscadores, también llamado posicionamiento orgánico. Sin indexación, todas las optimizaciones SEO que hagas no valdrán de nada, ya que tu web no se mostrará en los resultados de Google. Desde hace algún tiempo, Google no indexa tan fácilmente algunas páginas como en años anteriores. En este artículo te enseño todos los secretos para indexar en Google tu sitio web.
¡Empecemos!
Índice de contenidos
- 1 Conceptos previos
- 2 Cómo saber si mi web está indexada
- 3 ¿Por qué mi web no aparece en Google?
- 3.1 Página alternativa con etiqueta canónica adecuada
- 3.2 Página con redirección
- 3.3 Excluida por una etiqueta «noindex»
- 3.4 Soft 404
- 3.5 No se ha encontrado (404)
- 3.6 Bloqueada por robots.txt
- 3.7 Duplicada: el usuario no ha indicado ninguna versión canónica
- 3.8 Error de servidor 5XX
- 3.9 Rastreada: actualmente sin indexar
- 4 Cómo hacer que Google indexe mi web
- 5 ¿Cuánto tarda Google en indexar una web?
- 6 Conclusión
Conceptos previos
Antes de nada, es necesario que conozcas los conceptos de rastreo e indexación y que sepas qué proceso sigue Google a la hora de indexar una web. Si ya conoces estos conceptos, puedes saltar al siguiente punto.
En primer lugar, Google tiene que descubrir si una determinada URL existe. Si te limitas a publicar una web, es posible que Google no la encuentre nunca. Una vez descubierta, Google procede a rastrearla (a «leerla») con el objetivo de entender su contenido. Después, la indexa, es decir, la añade a su índice (su base de datos de páginas web).
Estos tres procesos no se suelen dar de forma simultánea y ni siquiera tienen por qué darse. Sigue leyendo y comprenderás por qué.
Cómo saber si mi web está indexada
Lo primero de todo es saber si tu web está indexada o no en Google. La forma más sencilla es abrir una ventana de incógnito en Google y escribir el comando site: junto con la URL de la web. Por ejemplo, ejecutando la siguiente búsqueda, el buscador nos muestra todos los resultados que tiene indexados pertenecientes al dominio de Caronte Web Studio:
site:https://carontestudio.com
Sin embargo, la opción más adecuada es acceder a la propiedad del sitio web en Google Search Console y observar el informe denominado «Páginas», el cual muestra las URL que han sido indexadas y las que no. Si todavía no has dado de alta tu sitio web en Search Console, empieza por aquí. Puedes encontrar información sobre ello consultando la documentación oficial de Google en esta página.
El informe de «Páginas» te mostrará una gráfica como la siguiente, donde se indican las URL del sitio web detectadas por Google, diferenciando aquellas que no han sido indexadas de las que sí:
¿Por qué mi web no aparece en Google?
Las posibles razones por las que una determinada URL no ha sido indexada en Google son múltiples. En el informe de Google Search Console mencionado en el punto anterior, se muestran los motivos por los que Google no ha indexado las distintas URL de la web. En la siguiente captura se puede ver un ejemplo:
Hay que tener en cuenta que este informe puede recoger muchas URL que no están indexadas y que ello puede ser lo correcto desde una perspectiva SEO.
Recuerda que un experto SEO no debe pretender indexar todos los recursos de la web, nada más lejos de la realidad. El objetivo es que las páginas de interés para el posicionamiento estén indexadas y que los demás recursos no lo estén.
Por ejemplo, no sería correcto que Google tuviese indexada la versión no segura de este sitio web (sin SSL), cuya URL es el siguiente: http://carontestudio.com. En este caso, lo correcto es que la URL no se encuentre indexada por el motivo «Página con redirección», es decir, debido a que se encuentre redirigida a la URL con SSL: https://carontestudio.com.
En caso de que las páginas importantes de tu sitio web no se encuentren indexadas por alguno de los motivos anteriores, no te preocupes. A continuación realizo un repaso de todos ellos.
Página alternativa con etiqueta canónica adecuada
Esto significa que hay otra página del sitio web que ha sido declarada como canónica en el código fuente de la URL que no está siendo indexada. El uso de etiquetas canónicas es importante en cualquier sitio web y especialmente útil cuando se implementan paginaciones o páginas móviles aceleradas (AMP).
Por ejemplo, en este sitio web no se encuentra indexada la siguiente URL: https://carontestudio.com/blog/bootstrap-como-instalar/amp/. La razón de ello es que esta página tiene declarada en su etiqueta canónica la URL https://carontestudio.com/blog/bootstrap-como-instalar/.
Ello se puede comprobar en el código fuente de la página, buscando la etiqueta <link rel=»canonical»>:
<link rel="canonical" href="https://carontestudio.com/blog/bootstrap-como-instalar/" class="yoast-seo-meta-tag" />
Y te preguntarás, ¿cuál es el objetivo de esto? Bien, las etiquetas canónicas se utilizan para evitar problemas por contenido duplicado. Si las dos URL anteriores estuviesen indexadas, habría dos páginas indexadas con el mismo contenido, de forma que el posicionamiento de ambas podría verse perjudicado.
Para ver el código fuente de una URL, puedes hacer clic derecho en cualquier parte de la página y seleccionar la opción «Ver código fuente de la página». Después, busca la palabra canonical y comprueba si la URL ubicada dentro del atributo href es diferente a la de la página que estás analizando.
Si tienes este problema en WordPress, te recomiendo gestionar las etiquetas canónicas mediante el plugin Yoast SEO. Puedes encontrar más información sobre la gestión de etiquetas canónicas con Yoast en este artículo.
Página con redirección
Cuando una URL se encuentra redirigida a otra página, no se indexará en Google. Comprueba que al introducir la URL exacta de la página que deseas indexar el navegador no realice una redirección a otra URL.
Las redirecciones suelen ser realizadas desde un archivo .htaccess ubicado en la carpeta raíz del sitio web, pero en ocasiones se definen a través de plugins. Si tienes este problema, tendrás que investigar el origen de la redirección y eliminarla.
Ahora bien, si la URL final está bien posicionada, no te recomiendo eliminar la redirección, ya que ello puede provocar un empeoramiento del posicionamiento SEO.
Excluida por una etiqueta «noindex»
La etiqueta «noindex» es un tipo de meta-etiqueta HTML que se define en el código de la página para indicarle a Google que no indexe la URL. Para comprobar si tu página tiene este código en su interior, accede al código fuente de la página y comprueba si la página que quieres indexar cuenta con el fragmento <meta name=’robots’ content=’noindex.
<meta name='robots' content='noindex, follow' />
Si tienes este problema en WordPress, te recomiendo emplear el plugin Yoast SEO y definir la siguiente opción, de forma que dicho fragmento de código pase a estar compuesto por <meta name=’robots’ content=’index. Para más información sobre este tema, te recomiendo el siguiente artículo.
Soft 404
Un error Soft 404 se da cuando Google ha identificado una URL que considera que debería devolver un error 404, pero que está mostrando otro contenido. Este tipo de errores pueden surgir por diferentes razones, pero las más comunes son las siguientes:
- La página existe y tiene un código de respuesta 200, pero su contenido es muy pobre y es considerado por Google como thin content.
- La página tiene una redirección 301. Se produce cuando se han realizado redirecciones 301 masivas a la página principal.
- Páginas que devuelven un error 404 pero que, debido a una personalización de la página 404, no parece que estén mostrando ningún error.
Se trata de un error un tanto ambiguo. Sin embargo, en el caso que nos ocupa, si una de tus URL de interés muestra este error, asegúrate de que devuelve un código de estado 200 y que muestra el suficiente contenido de valor.
No se ha encontrado (404)
Son páginas que Google no ha podido encontrar debido a que devuelven un error 404. Ante este problema, comprueba que las páginas que quieres indexar se encuentran publicadas y disponibles, tanto para los usuarios como para los rastreadores.
Si estás trabajando sobre una web creada con WordPress, asegúrate de que estás tratando de visualizar la URL sin estar logueado, ya que si has iniciado sesión podrás visualizar páginas que no son públicas.
Bloqueada por robots.txt
El archivo robots.txt se encuentra en la carpeta raíz donde se encuentra la web y sirve para indicar a los rastreadores aquellos recursos que no deben rastrear, entre otras cosas. Si una determinada URL se encuentra bloqueada en el archivo robots.txt, no será indexable.
Para comprobarlo, accede al archivo robots.txt de tu sitio web y comprueba las directivas de tipo disallow. Por ejemplo, en esta web se encuentra en la siguiente URL: https://carontestudio.com/robots.txt.
Un uso muy habitual de directivas Disallow en WordPress es impedir que Google rastree las búsquedas internas. Por ejemplo, para realizar una búsqueda interna con la palabra «seo» en este blog, bastaría con ejecutar la siguiente URL:
https://carontestudio.com/blog/?s=seo
Ahora bien, ten en cuenta que podrían existir infinitos ejemplos como el anterior. Si Google los indexase, podría haber miles de resultados sin valor de nuestra web indexados, pudiendo tener efectos desastrosos en el SEO general del sitio web. Para ello, se emplean directivas Disallow como la siguiente:
Disallow: /*?
Sin embargo, debes tener cuidado de no bloquear páginas que te interesa indexar a través de este tipo de directivas.
Duplicada: el usuario no ha indicado ninguna versión canónica
Este problema ocurre cuando Google detecta contenido duplicado en la web, es decir, páginas prácticamente iguales. En estos casos, lo correcto es emplear etiquetas canónicas para indicar a Google cuál es la versión «buena» entre las distintas URL con contenido duplicado.
Si no se emplea una etiqueta canónica, Google decide por si mismo qué URL es la canónica y la que va a indexar. Si te encuentras con este problema, emplea una etiqueta canónica en las distintas URL con contenido duplicado apuntando a la URL de la página que deseas indexar.
Error de servidor 5XX
Los errores 5XX indican que la página no puede mostrarse debido a un error en el servidor. En estos casos, te recomiendo ponerte en contacto con tu proveedor de hosting y consultar este problema.
Ahora bien, ten cuenta que un error 5XX no tiene por qué «ser culpa del proveedor de hosting», en ocasiones hay errores en la propia web que provocan caídas en el servidor. Sin embargo, los administradores del hosting podrán darte más información sobre el tema.
Rastreada: actualmente sin indexar
Si has llegado hasta aquí, significa que Google ha rastreado tu URL y que no ha identificado ningún problema en ella. Sin embargo, no la ha indexado. ¿Por qué? Eso sólo lo saben ellos.
En ocasiones, basta con esperar un tiempo para que se indexe la URL. Sin embargo, en otras ocasiones Google no indexa la página por motivos desconocidos.
A continuación te explico todo aquellos que puedes hacer para tratar de indexar tu web.
Cómo hacer que Google indexe mi web
Hay diversas formas de favorecer que Google indexe tu web. La principal es emplear la herramienta Google Search Console, lo cual será suficiente en la mayoría de los casos. Sin embargo, también existen otras prácticas menos ortodoxas que pueden ser empleadas para tratar de forzar la indexación (aunque pueden conllevar peligros). Te las muestro a continuación.
Indexa tu web con Google Search Console
Lo primero que debes hacer en Google Search Console es añadir en el apartado Sitemaps la ruta al archivo sitemap.xml de tu sitio web.
Este archivo incluye todas las URL de tu sitio web y sirve a los rastreadores para descubrirlas y proceder a rastrearlas. Si no existe este archivo en tu web, es necesario crearlo. Para ello, te recomiendo instalar Yoast SEO, este plugin creará el archivo y lo mantendrá actualizado de forma automática.
Para encontrar la ruta al mismo, debes acceder a la pestaña de Yoast SEO -> General -> Características -> Mapas del sitio XML y pulsar en el signo de interrogación. Se mostrará un enlace con el texto «Ver el mapa del sitio XML», el cual dirige a la URL que necesitas.
A continuación, accede a la sección Sitemaps de Google Search Console y añade la URL anterior en el siguiente apartado:
Además de ello, puedes tratar de indexar tu web solicitándolo en el inspector de URL disponible en la parte superior de Google Search Console. Introduce de una en una las URL que quieras indexar:
Después, puedes emplear el botón de «Solicitar indexación»:
Si tus URL no se indexan, revisa que no tengan errores, como te he mostrado en el punto anterior. En la mayoría de casos, con esto será suficiente.
Si ya has realizado todo lo anterior y no has obtenido resultados, te recomiendo que contactes con una agencia SEO que pueda revisar el problema. Si prefieres continuar por tu cuenta, a continuación te muestro algunas alternativas que puedes usar para indexar tu web.
Indexa tu web creando enlaces
El linkbuilding es una técnica basada en crear enlaces en webs de terceros que apunten a la web propia. Normalmente, se hace con el objetivo de manipular la autoridad de una determinada web para favorecer su posicionamiento.
Tienes que tener en cuenta que se trata de una técnica que va en contra de las directrices de Google (a pesar de que lo hace todo el mundo) y que se ubica dentro del SEO Black Hat. Ello implica que Google puede penalizar el posicionamiento de tu web si detecta este tipo de prácticas.
Ahora bien, si tu web no se indexa, es posible que estés dispuesto a correr el riesgo de que Google te penalice, ya que una web que no está indexada en Google no puede empeorar su visibilidad en el buscador.
El beneficio de crear enlaces hacia tu web es que estarás forzando a que el robot de Google pase por ella, favoreciendo que la rastree y que le otorgue una mayor importancia. Para hacerlo sin peligro, te recomiendo emplear directorios de empresas, redes sociales y sitios web de temáticas afines, además de emplear como anchor text (el texto del enlace) el nombre de marca, la URL o un texto genérico del estilo «sitio web», «pinche aquí» o similar.
Aunque desde Google no acostumbran a admitir la eficacia de técnicas Black Hat, en el siguiente fragmento de vídeo recogido por Miguel Cidre se observa al propio John Mueller recomendando esta práctica para favorecer la indexación:
Indexar una web mediante Google Cloud Platform y Rank Math
Por último, si nada de lo anterior ha dado resultado, existe una manera de forzar la indexación de una web en Google a través de una integración disponible entre el plugin Rank Math y Google Cloud Platform.
Se trata de una medida drástica pero que puede ser efectiva. En Caronte Web Studio hemos comprobado su eficacia con sitios web cuyas páginas no eran indexadas siguiendo los métodos anteriores. Dado que se trata de un método complejo y extenso, te dejo el siguiente artículo del blog oficial de Rank Math, donde se explica todo el proceso.
¿Cuánto tarda Google en indexar una web?
Aunque hayas hecho todo lo que esté en tu mano para indexar tu sitio web, en lo que se refiere a Google nada es inmediato y no hay reglas exactas. Es por ello que nadie puede afirmar cuánto tardará tu sitio web en ser indexado, ya que es un proceso que depende de factores muy diversos.
Sin embargo, de forma orientativa, te diré que después de 1 mes realizando todas las acciones recomendadas en este artículo, tu sitio web debería estar indexado al menos parcialmente. Es decir, si después de un mes no se han indexado las páginas principales de tu web (la home y las que más enlaces internos reciben), puede que debas empezar a considerar la realización de técnicas algo más «black», como la creación de enlaces o la indexación a través de la API de Google Cloud Platform.
Conclusión
Recuerda, emplea Google Search Console para que Google descubra y rastree tu web y para analizar los errores que se muestran en el informe de «Páginas». En la mayoría de casos, con esto será suficiente. Si no consigues indexar, trata de crear backlinks y, por último, prueba la API de Rank Math.
Espero que este artículo te haya servido de ayuda para conseguir indexar tu web.
¡Hasta la próxima!