Cómo bloquear los bots malos usando .htaccess

Cómo bloquear los bots malos usando .htaccess

Si es propietario de un sitio web, probablemente sea consciente de la importancia de la optimización de motores de búsqueda (SEO). Sin embargo, lo que muchos propietarios de sitios web no se dan cuenta es que hay bots que se arrastran por Internet que pueden dañar el SEO y la funcionalidad general de su sitio. Los bots malos pueden dañar su sitio de varias maneras, como raspar su contenido, enviar spam a sus formularios e incluso realizar ataques DDoS.

En este artículo, discutiremos cómo puede usar .Htaccess para bloquear los bots malos para acceder a su sitio.

Identificar bots malos

Antes de poder bloquear los bots malos, debe saber a cuáles apuntar. Hay muchas herramientas disponibles que pueden ayudarlo a identificar los bots que acceden a su sitio. Google Analytics, por ejemplo, puede mostrarle a qué bots accede a su sitio, con qué frecuencia lo están haciendo y qué páginas están visitando.

Una vez que haya identificado los bots que desea bloquear, puede usar .Htaccess para crear una lista negra de agentes de usuarios. Un agente de usuarios es una cadena que los bots se usan para identificarse en su sitio. Por ejemplo, GoogleBot se identifica con la cadena del agente de usuario "Googlebot."

Crea una lista negra

Para crear una lista negra de agentes de usuario, puede usar el siguiente código en su .archivo htaccess:

ReWreiteEngine en RewriteCond %http_user_agent badbot1 [nc, o] rewritecond %http_user_agent badbot2 [nc, o] rewritecond %http_user_agent badbot3 rewriterule ^((.*) $ - [f, l]
12345ReWreiteEngine onRwritecond %http_user_agent badbot1 [nc, o] Rewritecond %http_user_agent badbot2 [nc, o] rewritecond %http_user_agent badbot3rewriterule ^((.*) $ - [f, l]

En este ejemplo, estamos usando el Reescritura Directiva para verificar si el Http_user_agent El encabezado coincide con uno de nuestros bots malos. Si es así, usamos la Directiva Rewriterule para devolver un error prohibido 403.

El CAROLINA DEL NORTE bandera significa "no hay caso", lo que significa que la coincidencia es insensible. El O la bandera significa que estamos revisando múltiples condiciones y el L La bandera significa que esta es la última regla que se procesará.

Pon a prueba tu .archivo htaccess

Una vez que haya creado su lista negra, es importante probar su .archivo htaccess para asegurarse de que funcione como se esperaba. Puede usar herramientas como las herramientas webmaster de Google para monitorear el tráfico de su sitio y asegurarse de que los bots a los que se dirige se están bloqueando.

También puede usar una herramienta como Bad Bot Blocker para crear automáticamente una lista de bots malos para bloquear. Esta herramienta actualizará automáticamente su .archivo htaccess con una lista de bots malos, lo que facilita mantener su sitio protegido de bots dañinos.

Conclusión

Bloquear Bad Bots es un paso importante para proteger su sitio web de ataques maliciosos. Mediante el uso .Htaccess Para crear una lista negra de agentes de usuarios, puede evitar que los bots dañinos accedan a su sitio y mejoren su seguridad general. Recuerde monitorear regularmente el tráfico de su sitio y actualizar su lista negra según sea necesario para mantener protegido su sitio.