Para que las empresas utilicen eficazmente sus datos para la IA con fines predictivos, es necesario utilizar una variedad de datos, y especialmente datos amplios.
En el vertiginoso mundo digital actual, el uso de los datos evoluciona constantemente para ayudar a las empresas a comprender mejor las percepciones de cantidades masivas de repositorios de datos estructurados y no estructurados. Sin embargo, aunque el big data puede proporcionar análisis críticos para el negocio, los datos sirven sobre todo para mostrar lo que ha sucedido. Tiempo pasado. Cada vez más, hay que tener en cuenta los datos amplios a la hora de realizar análisis predictivos y prescriptivos.
Ahí es donde la inteligencia artificial puede ayudar y donde las necesidades de big data para la IA divergen. Desglosando, el big data se define por tres factores: volumen, velocidad y variedad. El volumen se refiere al tamaño de los datos disponibles; la velocidad, por su parte, se refiere a la rapidez con la que llegan y se procesan los datos.
Sin embargo, para que las empresas utilicen eficazmente sus datos para la IA con fines predictivos, es necesario que haya variedad de datos. Con el aumento de la adopción de la IA en todos los sectores, la capacidad de acceder a diversos conjuntos de datos es primordial y un catalizador para los algoritmos de IA. En otras palabras, hay que evitar que los datos sean demasiado simples y condimentarlos con mucha más variedad.
A estos datos con variedad los llamamos «datos amplios», que proceden de los datos internos, externos, estructurados y no estructurados de una organización. Esto es crucial porque, en la economía globalizada, el rendimiento empresarial depende de muchos parámetros.
Un ejemplo de datos amplios es observar dos plantas de fabricación que diseñan productos en diferentes partes de América. La ubicación geográfica de estas dos plantas tendrá un impacto en la producción, especialmente si se producen fenómenos naturales, como tormentas de nieve. Si se tiene en cuenta el clima y otros factores externos dispares, combinados con los datos internos para alimentar los algoritmos de IA, se obtendrán predicciones más precisas relacionadas con el inventario, la cadena de suministro y la demanda de cada organización de fabricación. La variedad de datos ofrece más correlaciones y, por tanto, un mejor aprendizaje para que los algoritmos de IA proporcionen resultados precisos.
¿Por qué no el volumen?
El volumen no significa necesariamente un mejor aprendizaje para el algoritmo debido a la falta de diferentes variables dependientes. Aunque, en teoría, tener muchos datos es importante para las aplicaciones de IA, el tamaño es menos importante que la variedad para los algoritmos eficientes.
Tomemos, por ejemplo, un proyecto en el que estábamos trabajando que predecía datos de pacientes con cáncer. No había muchos pacientes que estudiar, por lo que sólo había 150 filas de datos. Esto producía una cantidad relativamente pequeña de datos que había que cribar, y no se consideraba big data. Esto planteó la pregunta: ¿había suficientes datos para que un algoritmo de IA aprendiera y predijera los resultados de los pacientes con cáncer? La respuesta, en este caso, era afirmativa. Porque aunque sólo había 150 filas, los datos biométricos, de biosensores y de síntomas constituían miles de columnas, lo que los convertía en datos amplios.