Las regulaciones en materia de privacidad pueden llegar a influir negativamente en el uso de los data lakes.
Las mayores empresas de hoy en día se enfrentan a un aluvión de violaciones de datos, desde los gigantes de las redes sociales hasta las empresas de tarjetas de crédito y las organizaciones sanitarias. De hecho, en los primeros seis meses de 2019 se produjeron más de 3800 filtraciones divulgadas públicamente y 4.100 millones de registros personales comprometidos. Estas brechas, junto con el mal uso y el abuso de la información privada, continúan erosionando la confianza del consumidor. En respuesta, las empresas están desarrollando soluciones para implementar controles de privacidad y seguridad que rastrean, bloquean y restringen el acceso a los datos personales.
A medida que el público es cada vez más consciente de las violaciones de datos y de cómo se roba la información personal, las organizaciones y sus clientes se preguntan cómo y por qué se utilizan los datos personales. Las preguntas llegan en forma de solicitudes de los interesados (DSR). Aunque los datos sean los reyes, el cumplimiento de la privacidad es lo que manda en el reino. Ahora es más importante que nunca entender estas preguntas y cómo abordar el creciente volumen de solicitudes de datos.
El aumento de la preocupación por la privacidad de los datos
Regulaciones como el Reglamento General de Protección de Datos (GDPR) y la próxima Ley de Privacidad del Consumidor de California (CCPA) están obligando a las empresas a responder a las DSR y a responder a las preocupaciones de los consumidores sobre la privacidad (y con razón). Sin embargo, lograr el cumplimiento de estas regulaciones requiere que las empresas entiendan qué información personal tienen en cada ecosistema, dónde se encuentra y cómo se está utilizando.
Los lagos de datos son depósitos útiles para recopilar cantidades masivas de datos en su formato original, con la idea de que los datos acaben siendo objeto de análisis, pero los riesgos para la privacidad acechan a estos sistemas. Estos enormes depósitos de almacenamiento pueden plantear graves problemas cuando un cliente presenta una DSR. Los lagos de datos están continuamente ingiriendo piezas dispares de datos de clientes procedentes de diversas fuentes, por lo que las organizaciones a menudo no tienen idea de qué información sensible tienen y cómo se está combinando.
Por ejemplo, los datos individuales pueden ser seguros por sí solos, pero cuando se combinan pueden aumentar el riesgo de cumplimiento. Por ejemplo, los campos de género, código postal y fecha de nacimiento son benignos por separado, pero cuando se combinan pueden identificar al 87% de la población de Estados Unidos.
Uso de la automatización para supervisar los lagos de datos
Para saber y comprender exactamente qué información hay en sus lagos de datos, las empresas deben inspeccionar sus datos hasta el nivel de los elementos de datos y no confiar en lo que implican sus metadatos. Al operar a ese nivel, las empresas también pueden identificar las combinaciones de datos altamente sensibles en todo su ecosistema para protegerse de los riesgos de seguridad y seguir cumpliendo la normativa.
Para protegerse de los problemas de cumplimiento de los lagos de datos, las organizaciones deben implementar soluciones automatizadas de gestión de la privacidad de los datos para identificar rápidamente dónde se encuentra la información personal en sus sistemas. Si las organizaciones siguen utilizando procesos manuales obsoletos, corren el riesgo de cometer errores humanos causados por el flujo constante de datos que se introducen y por los equipos de privacidad que trabajan muchas horas para organizar manualmente cada pieza de información.
Las empresas también necesitan supervisar todos los datos que entran y salen de sus sistemas, comprobando, escaneando y clasificando continuamente los datos en movimiento. Una solución automatizada de inventario de datos y privacidad puede ayudar en este esfuerzo y utilizar la desidentificación o anonimización para evitar que los analistas de datos conecten a los individuos con su información personal. De este modo, los datos pueden seguir utilizándose para impulsar la innovación empresarial sin comprometer la privacidad.