Crean un algoritmo que puede identificarte aunque uses Tor

Software

La principal ventaja de utilizar Tor para navegar por Internet es poder hacerlo de manera anónima sin que nos identifiquen. Sin embargo, un grupo de investigadores italianos ha creado un algoritmo que es capaz de adivinar, con una precisión del 97%, qué usuarios está usando determinadas apps en Android.

Cada app genera un tráfico TCP diferente, y puede identificarse

Este algoritmo no busca desanonimizar al usuario y obtener su IP real, sino que puede detectar si un usuario está accediendo a una web o servicio y a través de qué app de Android lo hace. Esta investigación va un paso más allá de una que hicieron otros investigadores italianos, donde podían analizar paquetes TCP y distinguirlos de ocho tipos de tráfico distinto: navegación web, email, chat, streaming de música, streaming de vídeo, transferencia de archivos, VoIP y P2P.

tor android

Basándose en ese trabajo, los investigadores analizaron los paquetes TCP de una conexión de Tor para detectar patrones relacionados con apps de Android, y crearon un algoritmo de machine learning basado en él, el cual entrenaron para identificar patrones de tráfico en diez apps: el propio navegador de Tor, Instagram, Facebook, Skype, uTorrent, Spotify, Twitch, YouTube, DailyMotion, y Replaio Radio.

Cuando consiguieron entrenar el algoritmo, pudieron detectar de qué app provenía cada tráfico con una precisión del 97,3%. Por desgracia, el sistema no es perfecto, y solo funciona si no hay tráfico de fondo que genere «ruido«, por lo que no puede haber otras aplicaciones instaladas generando tráfico en los dispositivos. Si hay varias apps generando tráfico a la vez, los patrones se hacen ininteligibles y la eficiencia del algoritmo cae.

Algunas apps de streaming generan falsos positivos al tener un tráfico similar

Algunos de los falsos positivos de las aplicaciones de streaming tienen que ver con que el tráfico que generan es muy similar. Por ejemplo, el algoritmo generaba varios falsos positivos con Spotify y YouTube, las cuales generan patrones de tráfico muy similar. Otro problema al que se enfrenta el algoritmo es que algunas apps como Facebook o el Navegador Tor están mucho rato en reposo sin estar generando tráfico.

El siguiente paso de la investigación será identificar patrones de más aplicaciones, lo cual puede tener un efecto negativo en la propia precisión del algoritmo al introducir más variables, reduciendo finalmente su precisión, lo cual buscarán contrarrestar optimizando el algoritmo. Desde el equipo de investigación afirman que este es el primer «ataque» contra Tor que consigue desanonimizar el tráfico en función de la app de la que provenga.

Escrito por Alberto García

Fuente > ZDNet