¿Por qué el Big Data no cumplió la promesa de combatir la Covid-19?

La falta de previsión sobre la duración de la pandemia y los objetivos comerciales de muchas aplicaciones ha dificultado que la recopilación de datos de los usuarios fuera útil a nivel de salud pública.

Cuando se produjo la pandemia, las empresas tecnológicas se comprometieron a poner de su parte abriendo sus conjuntos de datos secretos y dejando que los investigadores de salud pública los analizaran en busca de pistas sobre cómo controlar el Covid-19. Dos años después, está claro que el big data no es la panacea que esperaban.

«Al principio, cuando todo el mundo estaba asustado, se pensaba que habría un momento mágico en el que los datos se materializarían y responderían a nuestras preguntas, y nos adaptaríamos y controlaríamos la pandemia y todo iría bien», dijo Andrew Schroeder, codirector de la Red de Datos de Movilidad de Covid-19, un grupo de investigadores académicos y socios sin ánimo de lucro que recogieron los datos de localización de los teléfonos inteligentes compartidos por las empresas tecnológicas para que los funcionarios de salud pública pudieran analizarlos en busca de información sobre las medidas de bloqueo y distanciamiento.

Objetivos de salud pública

«Y luego este momento nunca llegó», dijo Schroeder, también vicepresidente de investigación y análisis de Direct Relief, una organización sin ánimo de lucro de ayuda en caso de catástrofe. En parte, esto se debe a que la pandemia se ha prolongado mucho más de lo que la mayoría había previsto. Pero como Schroeder y sus codirectores exponen en un dictamen publicado  en PLOS Digital Health, también se debe a que los objetivos de salud pública chocan frontalmente con los intereses comerciales de las empresas que facilitan sus datos para el análisis, entre ellas Facebook y un grupo de empresas de tecnología publicitaria que vinculan los clics a los datos de localización.

La recopilación y el análisis de datos suelen estar optimizados para obtener el máximo impacto comercial, no para la salud pública. «Se puede imaginar que la forma en que se recogen los puntos GPS o los datos de comportamiento de Waze va a ser muy diferente de cómo se recogen esos datos de Tinder o de Grubhub», dijo Kishore. Y las decisiones que influyen en las preguntas que pueden responderse se toman mucho antes de que los investigadores consulten esos datos.

Facebook, por ejemplo, mitigó los riesgos para la privacidad compartiendo sólo métricas de movilidad precalculadas, como el porcentaje de cambio de movimiento y el porcentaje de usuarios de Facebook que se quedan en casa. Esto impidió calcular ciertas medidas granulares de movilidad, que los investigadores pensaron que, al principio de la pandemia, podrían servir como aproximación o entrada para calcular las tasas de contacto. (Un estudio de la red, publicado recientemente en la revista Lancet Digital Health, descubrió que hay demasiados factores de confusión para vincular los datos de movilidad a esa métrica).

Las métricas de Facebook también se basaban en la ubicación media de los usuarios en un tramo de ocho horas. Sin embargo, los trozos de tiempo solo se indicaban en UTC, lo que dificultaba su uso en zonas horarias en las que un trozo de ocho horas no coincidía con una noche de sueño en casa.

Así comparten los datos las redes

Estos retos se complican aún más por el hecho de que cada empresa tecnológica que ofrece sus datos lo hace de forma diferente, creando a veces métricas de movilidad contradictorias.

«De una semana a otra, Google, el proveedor A, me dice que hay más gente que se queda en casa, mientras que Facebook, el proveedor B, me dice que hay menos gente que se queda en casa», explica Kishore. «Y ahora la cuestión se reduce a mí, como investigador: ¿En quién confío?».

Schroeder dijo que la forma de compartir los datos personales en una crisis debería adaptarse a las necesidades de los funcionarios de salud pública, pero es poco probable que eso ocurra mientras sean las empresas las que los generen. «Sencillamente, no tenemos suficiente influencia» para animar a un gigante como Facebook a recopilar y analizar los datos de forma que se ajusten perfectamente a las necesidades de la sanidad pública, afirmó.

Eso no impide a Schroeder y sus colegas construir con las herramientas que tienen a mano. La Red de Datos de Movilidad de Covid-19 ha evolucionado hasta convertirse en un proyecto más amplio denominado Crisis Ready, cuyo objetivo es desarrollar acuerdos proactivos de intercambio de datos con las empresas que permitan que los conductos de datos sólo se abran cuando sea necesario en una crisis, minimizando los riesgos para la privacidad.

También están intentando preservar mejor la privacidad cuando se comparten los datos, probando sistemas que añaden ruido a los conjuntos de datos para que sea más difícil identificar a las personas. Una empresa de tecnología publicitaria, Cuebiq, está desarrollando una plataforma que permite a los investigadores analizar sus datos sin darles acceso directo. Pero «hay que investigar el equilibrio entre la protección de la intimidad y los posibles beneficios para la salud», dijo Kishore. «Ahora mismo estamos muy lejos de hacerlo porque no estamos en las salas donde están los datos».

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio