Big data, macrodatos, datos masivos, inteligencia de datos o datos a gran escala son múltiples definiciones para un mismo concepto. Estamos hartos de oír hablar del Big Data para muy pocos son los que realmente saben lo que significa a pesar de que es muy sencillo.
El Big Data es un conjuntos de datos tan grandes que aplicaciones informáticas tradicionales de procesamiento de datos no son suficientes para tratar con ellos. Engloba infraestructuras, tecnologías y servicios que han sido creados para dar solución al procesamiento de datos estructurados, no estructurados o semi-estructurados.
Son objeto de estudio a través del Big Data mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas… que pueden provenir de sensores, micrófonos, cámaras, escáneres médicos o imágenes.
Las ‘Vs’ del Big Data
¿Cuál es entonces la diferencia entre las aplicaciones analíticas y de gestión y los nuevos conceptos de Big Data? Las diferencias se asocian, en la mayoría de los artículos de referencia, a tres palabras, las tres V’s del Big Data: Volumen, Variedad y Velocidad (3V’s). Sin embargo, en base a la experiencia adquirida por las empresas pioneras en esta aventura, se ha ampliado la definición original, añadiendo nuevas características como son la Veracidad y Valor del dato (5V’s).
Cuando hablamos de grandes volúmenes nos referimos a tratamientos de Terabytes o Petabytes. En el concepto de variedad nos referimos a la inclusión de otros tipos de fuentes de datos diferentes a las que se utilizan de forma tradicional como las Redes Sociales. Por último, el concepto de velocidad se refiere a la rapidez con que los datos se reciben, se procesan y se toman decisiones a partir de ellos.
No menos importante que los anteriores conceptos encontramos la veracidad, esto es, confianza de los datos. Extraer datos de calidad eliminado la imprevisibilidad inherente de algunos, como el tiempo o la economía para, de esta forma, llegar a una correcta toma de decisiones. Finalmente, se añade el valor. La importancia del dato para el negocio, saber qué datos son los que se deben analizar, es fundamental. Tanto que ya se empieza a hablar del científico de datos, un profesional con perfil científico, tecnológico…y visión de negocio.