Artículo de Fabiola Pérez Ramos, cofundadora y CEO de MIOTI Tech & Business School.
Es un hecho que, cuando hablamos de Inteligencia Artificial, se nos vienen a la cabeza esos elevados volúmenes de datos que almacenan las empresas a diario y cómo sacar valor de ellos implementando modelos y algoritmos. Es decir, tendemos a relacionar la IA solo con el Big Data, algo que no resulta extraño, ya que la gran mayoría de los avances en Inteligencia Artificial han sido posibles gracias a grandes datasets de información. Las matemáticas que posibilitan los modelos de ciencia de datos llevan con nosotros décadas, pero no ha sido hasta que hemos generado los grandes datasets necesarios que hemos podido sacarles partido y usarlas para entrenar modelos de inteligencia artificial.
En este nuevo entorno tanto las empresas como los científicos de datos desechan el Small Data –bases de datos pequeñas, relacionales y tradicionales –, cuando es algo que las compañías deberían tener en cuenta si quieren seguir garantizando la continuidad de su negocio. Además, no debemos olvidar que el Big Data requiere mucha computación para poder entrenar los modelos de IA existentes, lo que se traduce en un elevado coste energético y en una importante inversión de tiempo, sin saber si se va a obtener un resultado favorable o no; nunca se tiene la certeza de que los algoritmos estén bien entrenados o no.
A pesar de que todas las compañías cuentan con ello, el hecho de que el Small Data haya sido un activo olvidado hasta ahora quizás se deba a que, al tratarse de pequeños volúmenes de información que se pueden grabar en archivos Excel, ficheros planos, pequeñas bases de datos, etc., no están lo suficientemente estructurados como para vincularse a otros tipos de información. De hecho, cuando comenzamos a utilizar las primeras técnicas de Big Data en el 2000, parecía que estas iban a arreglar los problemas de consistencia, acceso y almacenamiento de datos, y que el Small Data se iba a quedar atrás. Y es que el Big Data surgió para solucionar el reto de tener información a la que no se podía acceder fácilmente, y para procesar grandes volúmenes de información, que procedían de cualquier interacción que se realizase con el cliente, más allá del mero envío de facturas.
No obstante, a finales de 2021 el concepto de Small Data ha vuelto a irrumpir con fuerza, aunque esta vez referido a IA, y como el proceso de recuperar esas pequeñas bases de datos para resolver problemas muy específicos, utilizando modelos ya existentes, y reentrenándolos a través de una estrategia de Small Data eficiente. Esto se traduce en un importante ahorro de computación, costes y tiempo. Además, ya no es necesario generar enormes cantidades de datos para resolver una cuestión de negocio concreta, porque los pequeños conjuntos de información también pueden impactar en las decisiones presentes, ya que son lo suficientemente simples para la comprensión humana, además de ser muy factibles, concisos y fácilmente accesibles.
El transfer learning como impulsor del resurgimiento del Small Data
Aunque no es un fenómeno nuevo, y se han realizado muchas investigaciones en la última década, es un hecho que el transfer learning ha sido el aliado perfecto para convertir al Small Data en un importante activo para el futuro de la IA. Como una de las categorías que conforman el Small Data, diversos estudios posicionan el transfer learning como la categoría sobre la que más se ha investigado desde 2010, investigación que se prevé que siga creciendo en el próximo año. Por tanto, no es de extrañar que también se prevea que el transfer learning sea el modelo que más se esté utilizando actualmente, y al que más recurran las compañías que quieren aplicar IA en el futuro más inmediato.
No obstante, también es un hecho que hasta ahora el transfer learning no ha tenido mucha visibilidad en las empresas, sobre todo entre los responsables de la toma de decisiones importantes de negocio, como la de invertir y adoptar estrategias de IA. Pero se ha demostrado que las estrategias que utilizan pocos datos aplicados en IA, como el transfer learning, ofrecen más ventajas que el Big Data. Y es que, al utilizar menos información, impulsa el avance de áreas en las que apenas hay datos o estos son inexistentes. Por eso, el transfer learning se ha vuelto un activo imprescindible para aquellas corporaciones que quieran aventurarse a ampliar las áreas de aplicación de la IA, que son innumerables.
Además, como parte de modelos que ya han sido entrenados previamente, el sistema de transfer learning agiliza el proceso de entrenamiento, lo que se traduce en un importante incremento en términos de eficiencia, además del significativo ahorro del que hablábamos antes, al no requerir de tantos recursos computacionales para entrenar los algoritmos.
Por otro lado, el transfer learning, como parte del Small Data y asociado a la Inteligencia Artificial, también puede tener aplicaciones en otros ámbitos que están más centrados en el día a día de las personas, y que van más allá del ámbito empresarial. De hecho, tal y como prevén varios expertos de la industria, podría llegar a convertirse en el siguiente motor que impulse el éxito del machine learning en la sociedad en general, ya que está empezando a aplicarse para, por ejemplo, descubrir variantes del cáncer, o incluso seguir innovando en el mundo de los videojuegos.
En definitiva, y en lo que a IA se refiere, si reconocemos los beneficios que aporta el transfer learning y la importancia del Small Data, a la vez que se apoyamos estas tecnologías con los recursos suficientes, sería posible superar algunos de los conceptos que se asientan en una concepción errónea sobre el papel que los datos juegan en la Inteligencia Artificial y, por el camino, fomentar la innovación hacia nuevas direcciones que lleven a potenciales nuevos descubrimientos y avances y finalmente, al progreso y a garantizar la continuidad de nuestro negocio.