Hogar Redes sociales Excluir una página web o sitio de los motores de búsqueda utilizando un archivo de texto de robots

Excluir una página web o sitio de los motores de búsqueda utilizando un archivo de texto de robots

Video: Hablador - Que tu Android lea por ti 2024

Video: Hablador - Que tu Android lea por ti 2024
Anonim

Puede usar un archivo de texto de robots para evitar que una araña de un motor de búsqueda rastree su sitio web o una parte de su sitio. Por ejemplo, puede tener una versión de desarrollo de su sitio web donde trabaje sobre cambios y adiciones para probarlos antes de que formen parte de su sitio web activo. No desea que los motores de búsqueda indexen esta copia "en curso" de su sitio web porque podría causar un conflicto de contenido duplicado con su sitio web real. Tampoco querrá que los usuarios encuentren sus páginas en progreso. Por lo tanto, debe evitar que los motores de búsqueda vean esas páginas.

El trabajo del archivo robots de texto es dar instrucciones a los motores de búsqueda sobre qué no arañar dentro de su sitio web. Este es un archivo de texto simple que puede crear usando un programa como el Bloc de notas, y luego guardarlo con el nombre del archivo robots. TXT. Coloque el archivo en la raíz de su sitio web (como www. yourdomain . Com / robots. Txt), que es donde las arañas esperan encontrarlo. De hecho, cada vez que las arañas de los motores de búsqueda ingresan a su sitio, lo primero que buscan es el archivo de texto de su robot. Es por eso que siempre tiene un archivo de texto de robots en su sitio, incluso si está en blanco. No desea que la primera impresión de las arañas de su sitio sea un error 404 (el error que aparece cuando no se puede localizar un archivo).

Con un archivo de texto de robots, puede excluir selectivamente determinadas páginas, directorios o todo el sitio. Tienes que escribir el código HTML, o las arañas lo ignoran. La sintaxis del comando que necesita utilizar proviene del Robots Exclusion Protocol (REP), que es un protocolo estándar para todos los sitios web. Y es muy exacto; solo se permiten comandos específicos, y deben escribirse correctamente con ubicación específica, letras mayúsculas / minúsculas, puntuación y espaciado. Este archivo es un lugar donde no desea que su Webmaster sea creativo.

Un archivo de texto de robots muy simple podría verse así:

User-agent: * Disallow: / personal /

Este archivo de texto de robots le dice a todos los robots de los motores de búsqueda que son bienvenidos rastrear en cualquier lugar de su sitio web excepto para el directorio llamado / personal /.

Antes de escribir una línea de comando (como Disallow: / personal /), primero debe identificar a qué robot (s) se dirige. En este caso, la línea User-agent: * se dirige a todos los robots porque usa un asterisco, que se conoce como el carácter comodín porque representa cualquier carácter. Si desea dar instrucciones diferentes a diferentes motores de búsqueda, como lo hacen muchos sitios, escriba líneas de agente de usuario separadas seguidas por sus líneas de comando específicas.En cada línea de User-agent, debería reemplazar el carácter de asterisco (*) con el nombre de un robot específico:

User-agent: Googlebot llamaría la atención de Google.

User-agent: Slurp abordaría Yahoo!.

User-agent: MSNBot abordaría Microsoft Live Search.

Tenga en cuenta que si el archivo de texto de su robot tiene User-agent: * instrucciones y otro User-agent: línea que especifica un robot específico, el robot específico sigue los comandos que le dio individualmente en vez de del instrucciones más generales.

Puedes escribir solo unos pocos comandos diferentes en un robot. archivo txt:

  • Excluyendo todo el sitio. Para excluir el robot de todo el servidor, use el comando:

    No permitir: /
    

    Este comando elimina realmente todas las páginas web de su sitio del índice de búsqueda, así que tenga cuidado no > hacer esto a menos que eso sea lo que realmente quieres. Excluyendo un directorio.

  • (Una advertencia: por lo general, desea ser mucho más selectivo que excluir todo un directorio). Para excluir un directorio (incluidos todos sus contenidos y subdirectorios), póngalo dentro de las barras inclinadas: No permitir: / personal /

    Excluyendo una página.
    
  • Puede escribir un comando para excluir solo una página en particular. Solo usa una barra al principio y debe incluir la extensión del archivo al final. Aquí hay un ejemplo: No permitir: / private-file. htm

    Dirigiendo las arañas a su mapa del sitio.
    
  • Además de Disallow:, otro comando útil para tus esfuerzos de SEO especifica dónde el robot puede encontrar tu mapa del sitio - la página que contiene enlaces en toda la organización de tu sitio, como una tabla de contenido: Mapa del sitio: // www. Tu dominio. com / sitemap. xml

Debe señalarse que, además de los comandos enumerados anteriormente, Google también reconoce Permitir. Esto solo se aplica a Google y puede confundir a otros motores, por lo que debe evitar usarlo.

Siempre debe incluir al final de su archivo de texto de robots un Sitemap: línea de comando. Esto garantiza que los robots encuentren su mapa del sitio, lo que les ayuda a navegar más completamente a través de su sitio para que más sitios se indexen.

Algunas notas sobre la sintaxis del archivo de texto de robots:

Los comandos distinguen entre mayúsculas y minúsculas, por lo que necesita una D mayúscula en Deshabilitar.

  • Siempre debe haber un espacio después de los dos puntos después del comando.

  • Para excluir un directorio completo, coloque una barra inclinada

  • después de y también antes de el nombre del directorio. Si está ejecutando en una máquina UNIX,

  • todo distingue entre mayúsculas y minúsculas. Todos los archivos no específicamente excluidos están disponibles para spidering e indexación.

  • Para ver una lista completa de los comandos, nombres de robots e instrucciones sobre cómo escribir archivos de texto de robots, vaya a las páginas de Web Robot.

Como salvaguarda adicional, hágalo parte del mantenimiento semanal de su sitio para verificar el archivo de texto de su robot. Es un interruptor de encendido / apagado tan poderoso para los esfuerzos de SEO de su sitio que merece una ojeada regular para asegurarse de que todavía esté "encendido" y funcione correctamente.

Excluir una página web o sitio de los motores de búsqueda utilizando un archivo de texto de robots

Selección del editor

Selección Preguntas que debe hacerle a un proveedor de equipos de red: muñecos

Selección Preguntas que debe hacerle a un proveedor de equipos de red: muñecos

Considere revisar los procesos de desarrollo de software de los proveedores como Parte de su evaluación de los nuevos equipos de red y seguridad, ya que puede ahorrarle tiempo y dinero en el futuro. Aquí hay algunas preguntas que puede hacerle a los proveedores sobre sus procesos de desarrollo de software: Versiones de software: descubra cuántas versiones de software existen diferentes ...

Piezas de una configuración de CoS - dummies

Piezas de una configuración de CoS - dummies

Clase de servicio (CoS) es cómo usted controla la inestabilidad y la demora en Tu red. La idea básica detrás de CoS es que examine el tráfico que ingresa a su red para determinar qué tipo de tráfico es. Una vez que conozca el tipo de tráfico (tráfico de voz, tráfico de datos, tráfico vinculado a un cliente en particular, etc.), ...

Escalar la capa de conmutación de acceso con dummies

Escalar la capa de conmutación de acceso con dummies

De Junos, es posible que esté buscando nuevas formas de escalar la conmutación de acceso capa de su centro de datos para admitir más servidores. Si es así, es posible que la migración a las soluciones de conmutación de acceso de Juniper Networks no solo sea rentable, sino que también proporcione una mayor flexibilidad en su red. Puede implementar conmutadores Juniper en una variedad de ...

Selección del editor

Ciudad del Vaticano, Casa de la Iglesia Católica - maniquíes

Ciudad del Vaticano, Casa de la Iglesia Católica - maniquíes

El jefe de la Iglesia Católica, el Papa, es también el jefe de la nación independiente más pequeña del mundo - Ciudad del Vaticano. Ciudad del Vaticano cubre solo 0. 2 millas cuadradas (108. 7 acres), tiene menos de mil habitantes, y descansa en el medio de Roma. Poco después de que el cristianismo fuera legalizado en A. D. 313, el Emperador ...

Los Siete Pecados Capitales de la Iglesia Católica - maniquíes

Los Siete Pecados Capitales de la Iglesia Católica - maniquíes

La Iglesia Católica sostiene que siete vicios en particular llevan a romper uno o más de los Diez Mandamientos. Estos malos hábitos particulares se llaman los siete pecados capitales porque, según el catolicismo, son pecados mortales, pecados que matan la vida de la gracia santificante. El Papa Gregorio el Grande formó la lista en ...

Los Misterios Dolorosos en el Catolicismo - muñecos

Los Misterios Dolorosos en el Catolicismo - muñecos

Los Misterios Dolorosos se rezan los martes y viernes sobre el Catolicismo, y le recuerdan al fieles de su pasión y muerte (también pueden decirse durante todo el tiempo de la Cuaresma, los 40 días antes de la Pascua): la agonía de Jesús en el jardín (Mateo 26: 36-56) La flagelación en el pilar (Mateo 27: 26) The Crowning ...

Selección del editor

Canon EOS Rebel T3i / 600D Para Dummies - Dummies

Canon EOS Rebel T3i / 600D Para Dummies - Dummies

Su T3i / 600D viene con muchas funciones que puede ser difícil recordar lo que hace cada control, especialmente si eres nuevo en fotografía SLR digital. Para ayudarlo a resolver todo, esta Hoja de referencia proporciona una guía de referencia rápida para los controles externos y los modos de exposición en su cámara. Imprímelo, mézclelo ...

Canon EOS Rebel SL1 / 100D para Dummies Cheat Sheet - Dummies

Canon EOS Rebel SL1 / 100D para Dummies Cheat Sheet - Dummies

SLRs digitales no fueron diseñadas para capturar video, pero debido al tamaño de los sensores y la gran cantidad de lentes, los dSLR, incluida la EOS Rebel SL1 / 100D de Canon, pueden capturar videos que compiten con los grabadores de video convencionales. Si planea grabar videos, considere comprar algunos accesorios específicos para su Canon SL1 / 100D. Canon fabrica excelentes accesorios ...

Canon EOS Rebel T4i / 650D para Dummies Hoja de referencia - Dummies

Canon EOS Rebel T4i / 650D para Dummies Hoja de referencia - Dummies

Su Canon EOS Rebel T4i / 650D está repleto de tantas características que puede ser difícil recordar lo que hace cada control, especialmente si eres nuevo en la fotografía SLR digital. Para ayudarlo a resolver todo, esta Hoja de referencia proporciona una guía de referencia rápida para los controles externos y los modos de exposición en su cámara. Imprimir ...