Question 1

¿Qué es Robots.txt?

Accepted Answer

El archivo robots.txt es un archivo de texto plano ubicado en la raíz de tu sitio web (ejemplo.com/robots.txt) que da instrucciones a los rastreadores de motores de búsqueda sobre qué URLs pueden acceder y cuáles no. No es un mecanismo de seguridad ni impide la indexación, sino una guía de rastreo que los bots bien comportados respetan. Funciona mediante directivas como "User-agent" (a qué bot aplica), "Allow" y "Disallow" (qué URLs permitir o bloquear).

Question 2

¿Por qué es importante Robots.txt para SEO?

Accepted Answer

Un robots.txt mal configurado puede bloquear el rastreo de páginas importantes, impidiendo que aparezcan en Google. Por otro lado, un robots.txt bien optimizado mejora tu crawl budget al evitar que los rastreadores gasten tiempo en URLs sin valor SEO como paneles de administración, páginas de carrito o filtros de búsqueda.

Question 3

¿Puedes darme un ejemplo práctico de Robots.txt?

Accepted Answer

Un sitio WordPress bloqueó accidentalmente /wp-content/uploads/ en su robots.txt. Como resultado, ninguna imagen del sitio se indexó en Google Images, perdiendo un 15% de tráfico potencial de búsqueda visual. Al corregirlo con Allow: /wp-content/uploads/ y esperar un ciclo de rastreo, recuperó el tráfico de imágenes en 3 semanas y descubrió que 12 imágenes rankeaban en el top 5 de Google Images.

Question 4

¿Cuáles son los errores más comunes con Robots.txt?

Accepted Answer

Usar "Disallow: /" que bloquea TODO el sitio completo (un error catastrófico sorprendentemente común). Bloquear archivos CSS y JS que Google necesita para renderizar correctamente la página. Pensar que robots.txt "protege" contenido sensible (no lo hace, solo guía a rastreadores éticos). No incluir la referencia al Sitemap al final del archivo para facilitar el descubrimiento

Question 5

¿Cuál es el mejor consejo profesional para Robots.txt?

Accepted Answer

Después de modificar tu robots.txt, usa la herramienta "Probador de robots.txt" en Google Search Console para verificar que no estás bloqueando URLs importantes. Un error aquí puede ser invisible durante meses y causar pérdidas de tráfico significativas. Además, recuerda que bloquear una URL con robots.txt no la des-indexa si ya está indexada: para eso necesitas la etiqueta noindex.

Robots.txt

¿Qué es Robots.txt?

¿Por qué importa?

Cómo aplicar Robots.txt paso a paso

Ejemplo práctico

Errores comunes

Tip pro

Preguntas frecuentes

Herramientas relacionadas

Términos relacionados

Aprende a aplicar Robots.txt como un profesional