Deloitte es la marca bajo la cual miles de profesionales organizados en firmas independientes colaboran para ofrecer servicios de auditoría. Big Data Magazine se entrevista con Montserrat Medina, Directora Digital en Deloitte, quien nos habla sobre la importancia del ‘Detective del dato’ en cualquier compañía.
Big Data Magazine (BDM): Desde tu experiencia en Deloitte y anteriormente en otras empresas ¿Cómo ha evolucionado en los últimos años la repercusión del manejo eficiente de los datos en España? ¿Se concienciaron muchos antes de la importancia de los datos en otros países como Estados Unidos?
Montserrat Medina (MM): En Estados Unidos, obviamente, están más avanzados -no en cuanto a la explotación del dato, pero sí en cuanto a la mentalidad y las ganas´-. No hay tanta resistencia interna o regulatoria. En EE.UU. no tienen esos problemas que hacen que la explotación del dato sea más compleja.
Hemos pasado muy rápido de cero a cien; de almacenar el dato a explotar el dato. Todo esto en cuestión de muy poco tiempo y creo que nos estamos saltando un paso fundamental de tratamiento del dato: ¿Es un buen dato o no? ¿Tiene sesgo o no? ¿Cómo transformo el dato?
Esto es una técnica que está ocurriendo en todas partes y España está imitando estos modelos, aunque de una forma mucho más impulsiva. En Estados Unidos, según mi experiencia, sí le dan más importancia al tratamiento del dato.
En Silicon Valley existen empresas que han nacido de ingenieros y que generan dinero de una forma ‘no proporcional’ al número de personas que tienen. Con lo cual, se pueden permitir contratar a gente de investigación y desarrollo, como lo están haciendo Google o Facebook. Por esta razón, creo que están más abiertos a probar cosas nuevas. Ha habido una ‘ola’ de querer hacerlo todo en casa que, desde mi punto de vista, no ha beneficiado al sector.
BDM: Has hablado de la transformación de datos impulsada por la Inteligencia Artificial, ¿es la unión del Big Data y la IA, la pareja perfecta? ¿Qué se aportan la una a la otra?
MM: Yo creo que el Big Data y la IA sí son la pareja perfecta, el problema es que ‘Inteligencia Artificial’ está muy explotada como concepto. Es decir, no se usa bien el concepto, dado que se está abusando del término. Hoy en día llaman IA a cualquier cosa. Pero es cierto que, si atribuimos a la IA su verdadero significado, en el que la IA debe poder ser autodidacta, con un sistema de Big Data que permita escalar todos los datos que se recojan a tiempo real, lo cual permite que haya un ‘feedback’ para retroalimentarse, la IA y el Big Data se convierten en la combinación perfecta.
Por el contrario, si lo que tengo es un agregador que mete todos los datos juntos y luego se aplican unos modelos que necesitan ser automatizados por un equipo de personas que no escala, eso no es la combinación perfecta entre Big Data e IA. De hecho, esto puede ser un detenimiento para la empresa.
BDM: He leído en tu LinkedIn que buscáis científicos e ingenieros de datos ¿Qué debe tener un buen data scientist o engineer? ¿Hay cantera en España?
MM: Hay muchísima confusión en el mercado. Yo distingo entre tres tipos de los que llamamos data scientist:
En primer lugar, el ‘Data Engineer’, quien facilita que los datos estén en un formato adecuado para ser tratados y disponibles en tiempo real. Esto es muy importante para la retroalimentación. Generalmente es una persona con formación de informático y tiene un interés en algoritmos, aunque no los construye, sino que los entiende.
El ‘Machine Learning Expert’ es quien aplica los modelos de machine learning. Aunque, en mi opinión, esto va a desaparecer.
Y, por último, lo que yo llamo ‘Detective del dato’. Este es el perfil que más me gusta y es el que contrato normalmente. Es una persona capaz de entender el dato: lo mira, lo entiende y separa lo que es señal de ruido. Es capaz de entender por qué un algoritmo funciona en un problema sencillo y hacer que funcione en uno más complejo.
En España hay mucho talento y, de hecho, hemos traído mucho de este talento a mi equipo en Silicom Valley. El talento de allí se sitúa en empresas muy grandes en posiciones muy favorables, por lo que es muy difícil atraerles. En España tenemos esta ‘naturaleza creativa’ y eso es lo que estamos buscando.
Aunque también es cierto que hay que saber hacer las preguntas correctas para identificar si esta persona es un ‘Machine learning Expert’, un ‘Data Engineer’ o un ‘Detective del dato’.
BDM: Se habla también mucho de Data Ethics. ¿Es posible un uso ético de los datos?
MM: No se trata de si el dato tiene ética, se trata de si el ‘data set’ que has usado para el entrenamiento tiene ética. No se trata de si el algoritmo tiene sesgo o no, se trata de la manera en la que se ha entrenado este algoritmo. Es difícil construirlo, pero si un set no tiene sesgo, el algoritmo tampoco lo va a tener.