El dirty data es el conjunto de datos incorrectos, incompletos, desactualizados o duplicados con los que se encuentran las empresas. Esto provoca que no puedan analizar correctamente el perfil de sus clientes.
Las empresas ya se han estado enfrentando a los problemas de gestión y análisis de datos, ya que se veían desbordados por el gran volumen de datos. A este problema, se le suma el hecho de que existan los dirty data. La empresa Hocelot, deeptech española, ha realizado un estudio donde las conclusiones demuestran que cada año en España hay una perdida de 321 millones de euros.
En los últimos años, los “dirty data”, es decir, el conjunto de datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos de las empresas, se han convertido en uno de los principales obstáculos para las compañías. Estos datos pueden ser incorrectos bien porque el usuario se ha equivocado al introducirlos o han quedado obsoletos (por ejemplo, por un cambio de domicilio), o bien porque han sido falsificados de forma intencionada con fines ilegales o delictivos en encuestas, formularios o solicitudes de prueba de un servicio.
Los datos aportados por Hocelot reflejan que, entre 2017 y 2019, el “dirty data” creció un 57 % en las bases de datos de las empresas españolas, y que el dato más falsificado es la edad, seguido por la localización y la dirección de email. En este sentido, los análisis realizados señalan que actualmente el 8 % de los españoles miente o aporta al menos un dato falso cuando se le solicitan datos personales en Internet. Los datos también demuestran que el 61% de los datos erróneos provienen de hombres y el 39% de mujeres.
Antonio Camacho, CEO de Hocelot afirma que “estamos percibiendo una mayor concienciación entre las empresas para implementar soluciones que les ayuden a identificar qué datos son incorrectos y limpiar y optimizar así sus bases de datos”. Asimismo, “esto también tiene beneficios directos sobre los clientes finales, que ven como los productos que les ofrecen las empresas se ajustan mejor a sus necesidades reales”, añade Camacho.
La importancia del dato actualizado
Contar con un dato fiable y actualizado es vital para las empresas que necesitan analizar el perfil de sus clientes para ofrecerles un producto personalizado (aseguradoras, bancos, compañías telefónicas…). Cuando esos datos son erróneos, es cuando las compañías incurren en pérdidas importantes, ya que se pierde agilidad en los procesos y se toman decisiones de negocio en base a análisis incorrectos.