Los datos y la interacción del usuario se organizan en estructuras de datos con forma de red. Al emplear redes neuronales se ha logrado identificar a más del 50% de los usuarios.
La forma de interactuar con una multitud puede ayudar a destacar entre ella, al menos para la inteligencia artificial. Nature Communications se hace eco de una investigación en la que se habla de que cuando se les proporciona información sobre las interacciones de un individuo con su teléfono móvil y las de sus contactos, la IA puede elegir correctamente al objetivo entre más de 40.000 suscriptores anónimos de servicios de telefonía móvil en más de la mitad de las ocasiones. Los resultados sugieren que los seres humanos socializan de una manera que podría utilizarse para seleccionarlos de conjuntos de datos supuestamente anónimos.
Círculos sociales
No es de extrañar que las personas tiendan a permanecer dentro de círculos sociales establecidos y que estas interacciones regulares formen un patrón estable a lo largo del tiempo, afirma Jaideep Srivastava, informático de la Universidad de Minnesota en Minneapolis que no participó en el estudio. «Pero el hecho de que se pueda utilizar ese patrón para identificar al individuo, esa parte es sorprendente».
Según el Reglamento General de Protección de Datos de la Unión Europea y la Ley de Privacidad del Consumidor , las empresas que recogen información sobre las interacciones diarias de las personas pueden compartir o vender estos datos sin el consentimiento de los usuarios. El problema es que los datos deben ser anónimos. Algunas organizaciones podrían suponer que pueden cumplir esta norma dando seudónimos a los usuarios, afirma Yves-Alexandre de Montjoye, investigador de privacidad computacional del Imperial College de Londres. «Nuestros resultados demuestran que esto no es cierto».
De Montjoye y sus colegas plantearon la hipótesis de que el comportamiento social de las personas podría utilizarse para seleccionarlas a partir de conjuntos de datos que contienen información sobre las interacciones de usuarios anónimos. Para probar su hipótesis, los investigadores enseñaron a una red neuronal artificial -una IA que simula los circuitos neuronales de un cerebro biológico- a reconocer patrones en las interacciones sociales semanales de los usuarios.
En una de las pruebas, los investigadores entrenaron la red neuronal con datos de un servicio de telefonía móvil no identificado que detallaba las interacciones de 43.606 abonados durante 14 semanas. Estos datos incluían la fecha, la hora, la duración, el tipo de interacción (llamada o texto), los seudónimos de las partes implicadas y quién inició la comunicación.
Los datos de las interacciones de cada usuario se organizaron en estructuras de datos con forma de red, compuestas por nodos que representaban al usuario y a sus contactos. Los nodos estaban conectados por cadenas con datos de interacción. Se mostró a la IA la red de interacciones de una persona conocida y luego se la dejó libre para que buscara en los datos anónimos la red que más se pareciera.
Redes neuronales
La red neuronal sólo relacionó el 14,7% de los individuos con su persona anónima cuando se le mostraron redes de interacción que contenían información sobre las interacciones telefónicas de un objetivo que se produjeron una semana después de los últimos registros del conjunto de datos anónimos. Sin embargo, identificó al 52,4 por ciento de las personas cuando se le dio no sólo información sobre las interacciones del objetivo, sino también las de sus contactos. Cuando los investigadores proporcionaron a la IA los datos de las interacciones del objetivo y de sus contactos recogidos 20 semanas después del conjunto de datos anónimos, la IA siguió identificando correctamente a los usuarios el 24,3% de las veces, lo que sugiere que el comportamiento social sigue siendo identificable durante largos periodos de tiempo.
Para comprobar si la IA podía perfilar el comportamiento social en otros lugares, los investigadores la probaron con un conjunto de datos consistente en cuatro semanas de datos de proximidad de los teléfonos móviles de 587 estudiantes universitarios anónimos, recogidos por investigadores de Copenhague. Incluían datos de interacción consistentes en los seudónimos de los estudiantes, las horas de encuentro y la intensidad de la señal recibida, que era indicativa de la proximidad a otros estudiantes. Estas métricas suelen ser recogidas por las aplicaciones de rastreo de contactos COVID-19. Con un objetivo y los datos de interacción de sus contactos, la IA identificó correctamente a los estudiantes del conjunto de datos el 26,4% de las veces.
Los investigadores señalan que los resultados probablemente no se apliquen a los protocolos de rastreo de contactos del sistema de notificaciones de Google y Apple, que protegen la privacidad de los usuarios encriptando todos los metadatos de Bluetooth y prohibiendo la recopilación de datos de localización.