¿Qué papel cumplen la Estadística Aplicada y R Software en la actual Ciencia de Datos? José Luis Loren, Digital Insights Manager de Zooplus, comparte su visión y su experiencia con Big Data Magazine para dar respuesta a esta cuestión.
Big Data Magazine (BDM): Cuéntanos sobre ti y cómo te posicionaste en el sector de la Ciencia de Datos.
José Luis Loren (JL): Soy José Luis Loren y desde hace casi una década resido en Munich, Alemania. Al comienzo de mi vida profesional desempeñé puestos relacionados con la dirección y administración de empresas y después de un breve periodo en la consultoría me centré en lo que verdaderamente ha sido y es mi pasión: los datos y la obtención de información relevante de ellos. Actualmente trabajo como Digital Insights Manager en Zooplus, comercio online de productos para mascotas líder en Europa.
BDM: ¿Qué tipo de proyectos lideras en tu día a día profesional?
JL: Como Digital Insights Manager lidero proyectos de analítica digital en toda la organización y entre departamentos que incluyen datos de una variedad de fuentes tanto internas como externas.
BDM: Desde tu experiencia como Senior Digital Insights Manager, ¿qué skills son fundamentales para introducirse en el sector de la Ciencia de Datos?
JL: La Ciencia de Datos es un campo muy amplio y todo el que quiera dedicarse a ello tiene que tener presente que se requieren numerosos skills para ser un buen científico de datos: estadística, Machine Learning e inteligencia artificial, programación (R, Python y SQL), extracción, procesamiento y visualización de datos, etc. Todos esos conocimientos se pueden adquirir a base de formación, pero hay una serie de skills con los que el aspirante a científico de datos tiene que venir “de casa” como son:
- Afinidad con los datos.
- Curiosidad por naturaleza. Un científico de datos tiene que tener curiosidad por descubrir la respuesta en los datos. Asimismo, tiene que estar constantemente atento a lo que ocurre en el campo de la Ciencia de Datos.
- Business acumen que permita entender los problemas que la empresa necesita resolver.
- Capacidad de comunicación, ya que de nada sirve todo el trabajo anterior si no se es capaz de comunicar los insights o resultados de una manera eficaz a personas con un conocimiento técnico limitado o casi inexistente.
- Capacidad de trabajo en equipo con personas del negocio, programadores, ingenieros de datos, etc. Raramente un científico de datos puede llevar a cabo ningún proyecto sin la ayuda y colaboración de otros departamentos.
BDM: La Estadística Aplicada ¿qué papel juega en el desarrollo de esas competencias?
JL: El papel que desarrolla la Estadística Aplicada es muy importante, ya que es el paso de la teoría a la aplicación práctica sobre el terreno. La Estadística Aplicada tiene utilidad en cualquier sector y actividad a la que se mire: investigación, comercio físico y online, financiero, etc.
BDM: En tu desempeño profesional con la operativa de datos, ¿qué valor crees que aporta el conocimiento profundo de esta disciplina?
JL: En mi caso resulta muy importante ya que me permite analizar los datos siguiendo un método para buscar contestación en los datos a las preguntas o problemas con los que se encuentra la empresa.
BDM: ¿Cómo adquiriste competencias avanzadas en Estadística Aplicada?
JL: La verdad es que no fue fácil ya que no acababa de dar con la formación adecuada, porque o bien era muy teórica sin aplicación práctica o bien se limitaba a aplicar funciones sin ninguna base teórica. Al final logré dar con un Máster en Estadística Aplicada con R en el que se combinaban las dos cosas y que me permitió no sólo adquirir los conocimientos teóricos sino también aprender a aplicarlos en R.
BDM: ¿Por qué R Software captó tu interés?
JL: Tengo que decir que al principio me costó un poco ya que R no es un lenguaje de programación al uso (no hay que olvidar que es un lenguaje desarrollado por y para estadísticos). Sin embargo, las posibilidades que ofrece a través de la infinidad de paquetes disponibles hacen que R sea mi opción preferida para la mayoría de los proyectos.
BDM: ¿Qué retos estadísticos permite afrontar R Software que no son abarcables con otras herramientas de análisis?
JL: Si nos fijamos únicamente en las opciones gratuitas, nos encontramos con dos: R y Python. Para mi trabajo, la verdad es que las diferencias entre ambas son cada vez más pequeñas, aunque sin embargo yo creo que R es todavía muy superior a Python en visualización de datos. Me consta que para Estadística avanzada y en sectores como la industria farmacéutica, R sigue siendo el lenguaje de referencia.
BDM: Desde esta perspectiva, el dominio de R Software parece muy motivador para plantearse nuevas metas profesionales en el sector de la Ciencia de Datos, ¿cuáles te planteas a corto plazo?
JL: La verdad es que una vez que entras en este mundo te das cuenta de cantidad de diferentes posibilidades que existen en función del campo en el que trabajes. En mi caso, tenía tomada la decisión de profundizar en temas relacionados con el aprendizaje automático y analítica predictiva, así que aproveché que Máxima Formación sacaba un Máster en Machine Learning con R para ello.
Contacta con José Luis Loren en su perfil de Linkedin.