Por qué los bots no pueden franquear las casillas de verificación «No soy un robot»

6 de febrero de 2023

¿Qué tan complicada puede ser una pequeña casilla de verificación? ¡No pueden imaginarlo!

Para empezar, Google inventó una máquina virtual completa, esencialmente una computadora simulada dentro de una computadora, solo para ejecutar esa casilla de verificación.

Esa máquina virtual utiliza el lenguaje propio de Google, que luego cifran… ¡Dos veces!

Pero este no es un cifrado simple. Normalmente, cuando protegés algo con contraseña, podés usar una clave para decodificarlo. El lenguaje inventado de Google se decodifica con una clave que se modifica por el proceso de lectura del idioma, y el idioma también cambia a medida que se lee.

Google combina (o hashea) esa clave con la dirección web que está visitando, por lo que no puede usar un CAPTCHA de un sitio web para evitar otro. Además, combina eso con las «huellas digitales» de su navegador, capturando variaciones microscópicas en tu computadora, que un bot podría tener dificultades para replicar (como las reglas CSS).

Todo esto se hace solo para que te resulte difícil entender lo que Google está haciendo. Necesitas crear herramientas solo para analizarlo (afortunadamente hay gente que ya lo hizo).

Resulta que estas casillas de verificación registran y analizan una gran cantidad de datos, entre ellos: la zona horaria y la hora de tu computadora; tu dirección IP y ubicación aproximada; tu tamaño de pantalla y resolución; el navegador y los complementos que estás usando; cuánto tiempo tardó en mostrarse la página; cuántas pulsaciones de teclas, clics con el mouse, y toques/desplazamientos se realizaron; y… algunas otras cosas que no entendemos del todo bien.

También sabemos que estas casillas le piden a tu navegador que dibuje una imagen invisible (PDF) y la envíe a Google para su verificación. La imagen contiene elementos como unas letras sin sentido, que (dependiendo de tu computadora) recurre a una fuente del sistema, y se dibujará de manera muy diferente. Luego agregan una imagen 3D con una textura especial, que se dibuja de tal manera que el resultado varía entre computadoras.

Finalmente, estas casillas de verificación aparentemente simples, combinan todos estos datos con su conocimiento de la persona que usa la computadora. Casi todas las personas en Internet usan algo que es de Google: búsqueda, correo, anuncios, mapas, y como todos sabemos, Google rastrea todas tus cosas. Cuando hacés clic en esa casilla de verificación, Google revisa el historial de tu navegador para ver si parece convincentemente humano.

Esto es fácil para ellos, porque están observando constantemente el comportamiento de miles de millones de personas reales.

Es imposible saber con exactitud cómo comprueban toda esta información, pero es casi seguro que utilizan el aprendizaje automático (o IA) en sus servidores privados, lo cual es imposible de replicar para un extraño. No sería sorprenderte que también construyeran una IA adversarial para tratar de vencer a su propia IA, y que ambos aprendan unos de otros.

Entonces, ¿por qué es tan difícil para un bot vencer todo esto? Porque ahora hay una ridícula cantidad de comportamientos humanos desordenados para simular, y son casi desconocidos, y siguen cambiando, y no se puede predecir cuándo. Es posible que tu bot tenga que registrarse en un servicio de Google y usarlo de manera convincente en una sola computadora, que debería verse diferente a las computadoras de otros bots, de una manera que no comprendemos. Es posible que necesite demoras convincentes y tropiezos entre las pulsaciones de teclas, el desplazamiento y los movimientos del mouse. Todo esto es increíblemente difícil de descifrar y enseñar en una computadora, y la complejidad tiene un costo financiero para el spammer. Podrían romperlo por un tiempo, pero si les cuesta (digamos) USD 1 por intento exitoso, realmente no vale la pena molestarse.

Sin embargo, la gente supera la protección de Google. Los CAPTCHA son una carrera de armamentos en curso que ninguna de las partes ganará. La tecnología IA que hace que el enfoque de Google sea tan difícil de engañar, es la misma tecnología que está adaptada para engañarlo.

Es sólo cuestión de esperar hasta que la IA sea lo suficientemente convincente para engañarte.

Dulces sueños, humanos.

Vía

Rosatti, el killer

Cuando putean juego mejor

Milei no es un dictador

Armenia: la memoria, el dolor y la fe

Partícipe necesario

Un navegador más seguro que el modo Incógnito de Chrome

¿El frío afecta más a la salud que el calor? Lo que revela un estudio en Rusia

Científicos argentinos investigan los procesos cerebrales detrás del sarcasmo

Internet se pudre: ¿estamos perdiendo nuestra memoria digital?

EE.UU.: la restricción del juego con la cabeza en el fútbol infantil redujo los índices de conmoción cerebral

Medias para tu helado: la nueva promoción de un supermercado japonés

Jóvenes chinos pagan para fingir que trabajan: la extraña solución ante el desempleo

Récord mundial entre la nieve: enterrado por más de dos horas con el cuerpo descubierto

Dormir al borde del abismo: una nueva atracción turística en China desafía el vértigo

El boxeo del futuro: en China ya organizan peleas de androides

Por qué los bots no pueden franquear las casillas de verificación «No soy un robot»

Lo último

Los mayores fracasos en la historia de Netflix

Día Mundial de los Océanos 2025: las mejores imágenes marinas

La lectura en la era de la inteligencia artificial: ¿estamos ante...

Organismos y medios internacionales, contra el hostigamiento de Milei a los...

Las series y películas más vistas en streaming en junio de...

Por qué los bots no pueden franquear las casillas de verificación «No soy un robot»

Tal vez te interese

Lo último