Interesante

Por qué los bots no pueden franquear las casillas de verificación “No soy un robot”

¿Qué tan complicada puede ser una pequeña casilla de verificación? ¡No pueden imaginarlo!


Para empezar, Google inventó una máquina virtual completa, esencialmente una computadora simulada dentro de una computadora, solo para ejecutar esa casilla de verificación.

Esa máquina virtual utiliza el lenguaje propio de Google, que luego cifran… ¡Dos veces!

Pero este no es un cifrado simple. Normalmente, cuando protegés algo con contraseña, podés usar una clave para decodificarlo. El lenguaje inventado de Google se decodifica con una clave que se modifica por el proceso de lectura del idioma, y ​​el idioma también cambia a medida que se lee.

Google combina (o hashea) esa clave con la dirección web que está visitando, por lo que no puede usar un CAPTCHA de un sitio web para evitar otro. Además, combina eso con las “huellas digitales” de su navegador, capturando variaciones microscópicas en tu computadora, que un bot podría tener dificultades para replicar (como las reglas CSS).

Todo esto se hace solo para que te resulte difícil entender lo que Google está haciendo. Necesitas crear herramientas solo para analizarlo (afortunadamente hay gente que ya lo hizo).

Resulta que estas casillas de verificación registran y analizan una gran cantidad de datos, entre ellos: la zona horaria y la hora de tu computadora; tu dirección IP y ubicación aproximada; tu tamaño de pantalla y resolución; el navegador y los complementos que estás usando; cuánto tiempo tardó en mostrarse la página; cuántas pulsaciones de teclas, clics con el mouse, y toques/desplazamientos se realizaron; y… algunas otras cosas que no entendemos del todo bien.

También sabemos que estas casillas le piden a tu navegador que dibuje una imagen invisible (PDF) y la envíe a Google para su verificación. La imagen contiene elementos como unas letras sin sentido, que (dependiendo de tu computadora) recurre a una fuente del sistema, y se dibujará de manera muy diferente. Luego agregan una imagen 3D con una textura especial, que se dibuja de tal manera que el resultado varía entre computadoras.

Finalmente, estas casillas de verificación aparentemente simples, combinan todos estos datos con su conocimiento de la persona que usa la computadora. Casi todas las personas en Internet usan algo que es de Google: búsqueda, correo, anuncios, mapas, y como todos sabemos, Google rastrea todas tus cosas. Cuando hacés clic en esa casilla de verificación, Google revisa el historial de tu navegador para ver si parece convincentemente humano.

Esto es fácil para ellos, porque están observando constantemente el comportamiento de miles de millones de personas reales.

Es imposible saber con exactitud cómo comprueban toda esta información, pero es casi seguro que utilizan el aprendizaje automático (o IA) en sus servidores privados, lo cual es imposible de replicar para un extraño. No sería sorprenderte que también construyeran una IA adversarial para tratar de vencer a su propia IA, y que ambos aprendan unos de otros.

Entonces, ¿por qué es tan difícil para un bot vencer todo esto? Porque ahora hay una ridícula cantidad de comportamientos humanos desordenados para simular, y son casi desconocidos, y siguen cambiando, y no se puede predecir cuándo. Es posible que tu bot tenga que registrarse en un servicio de Google y usarlo de manera convincente en una sola computadora, que debería verse diferente a las computadoras de otros bots, de una manera que no comprendemos. Es posible que necesite demoras convincentes y tropiezos entre las pulsaciones de teclas, el desplazamiento y los movimientos del mouse. Todo esto es increíblemente difícil de descifrar y enseñar en una computadora, y la complejidad tiene un costo financiero para el spammer. Podrían romperlo por un tiempo, pero si les cuesta (digamos) USD 1 por intento exitoso, realmente no vale la pena molestarse.

Sin embargo, la gente supera la protección de Google. Los CAPTCHA son una carrera de armamentos en curso que ninguna de las partes ganará. La tecnología IA que hace que el enfoque de Google sea tan difícil de engañar, es la misma tecnología que está adaptada para engañarlo.

Es sólo cuestión de esperar hasta que la IA sea lo suficientemente convincente para engañarte.

Dulces sueños, humanos.

Vía