Actualidad, Formación

DataOps, ¿de qué se trata la metodología de la que todos hablan en el mundo de los datos?

Data & Analytics forma parte del negocio, incide en la rentabilidad, la performance y en el impacto que las empresas generan. En un contexto con tanta demanda, DataOps busca acortar los ciclos de desarrollo, mantener la calidad de los entregables y evitar caer en soluciones falsas. ¿Por qué es necesario empezar a usar esta metodología?

El estadístico estadounidense Edwards Deming solía decir que sin datos somos solo otra persona con una opinión. Esta filosofía permeó en las empresas y durante los últimos años las áreas de data & analytics estuvieron más exigidas que nunca. Lo cual se tradujo, por un lado, en más proyectos, más confianza y más demanda y, por el otro, en más presión y más problemas.

“Lo que hacemos no sólo está de moda sino que se transformó en una necesidad que llegó para quedarse. Las prácticas en data & analytics, se van adoptando en mayor o menor medida y en un futuro no muy lejano, vamos a estar todos en la misma página” explica Guillermo Watson, Chief Data Officer de Datalytics, consultora totalmente enfocada en brindar servicios de analytics.

Cambios en la forma de trabajo en los últimos años

Los datos se han puesto de moda, esto no quiere decir que trabajar con ellos sea fácil. Las disciplinas que componen data & analytics –ya sea ingeniería de datos, visualización, machine learning, etc.— pasaron de ser algo importante a ser algo crítico para las empresas. Las áreas de datos ahora forman parte del core del negocio, inciden en las ganancias, la performance y en el impacto que las compañías generan. Hasta hace algunos años, un error en un modelo predictivo o en un reporte no era algo significativo, hoy la falla en un pipeline de datos puede dejar a una parte del negocio sin operar y generar un impacto directo en la rentabilidad.

En los últimos años, hubo una explosión en la demanda de datos por parte del negocio. Esto generó la necesidad de contar con nuevas herramientas, conceptos o tecnologías que permitieran consumir los datos de forma más amigable. Esta evolución generó al mismo tiempo una necesidad de alfabetización ya que las personas tenían que acercarse a los datos y usarlos para tomar sus decisiones.

“Las áreas de analytics son como la historia sin fin. Cada vez que implementamos cualquier producto de datos se genera una ola de nuevos pedidos: cambios, nuevos modelos, etc. Esto es muy bueno porque indica que lo que hacemos se utiliza, si nadie solicita nada es porque lo que hacemos no se implementa o no sirve”, complementa Watson.

Por algún motivo histórico, el desarrollo de data & analytics nunca fue del todo metodológico, esto es paradójico ya que metodologías hay muchas. La consecuencia de arrastrar problemas sin encontrar una solución es que baja la credibilidad de las áreas de datos en las empresas. Según el estudio Building trust in Data Analytics, realizado por la consultora KPMG, sólo el 51% de los encuestados cree que los ejecutivos de alto nivel apoyan plenamente la estrategia de data & analytics.

DataOps al rescate

“En un contexto con tantas demandas tenemos que pensar distinto. Para realizar productos de datos de forma más sólida hay que cambiar el approach de desarrollo. Hace pocos años empezamos a escuchar el término DataOps que es una combinación de agilismo, DevOps y Control Estadístico de Procesos. DataOps busca acortar los ciclos de desarrollo, mantener la calidad de lo que entregamos y evitar caer en soluciones falsas”, continua el experto.

DataOps es una metodología que combina:

Agilismo: La naturaleza de los proyectos de datos es cambiante, por eso el agilismo es ideal para organizar el desarrollo de los equipos. Es muy común que quienes vayan a usar el producto, soliciten algo y que después se den cuenta que eso no era precisamente lo que necesitaban. Por eso, para evitar desgastes innecesarios entre los equipos de datos y los usuarios del producto, lo más sano es involucrarlos desde el inicio del proyecto. Iterar de a poco, ofrecer avances de forma rápida e incremental y disminuir el ciclo de entregas.
DevOps: Permite gestionar la infraestructura de forma más automática. Para poder iterar rápido, es necesario contar con el hardware y el software necesarios, por eso cobra sentido el uso de la nube y los servicios PaaS o serverless que permiten establecer entornos de forma inmediata.
Control Estadístico de Procesos: El Statistical Process Control (SPC, por sus siglas en inglés) es lo que permitirá aplicar todo lo anterior a un proyecto de data & analytics. Imaginemos que el pipeline de datos es una cadena de montaje en la cual el dato crudo atraviesa diferentes etapas en las que el output de un proceso es el input del siguiente. SPC permite controlar de forma automática y en tiempo real, idealmente, todo el proceso de trabajo secuencial ya que genera controles automáticos que validen cada etapa. Hace posible controlar la cadena en cada uno de sus eslabones, si solo controláramos el inicio y el fin del proceso, sería muy difícil poder encontrar los errores, en caso que los hubiera.

“DataOps no pretende ser perfecto, define formas de trabajo y de controles para optimizar los resultados y asegura poder contener los problemas lo antes posible. Esta metodología contempla que, por más que nos esforcemos, lo que sea hagamos va a estar lejos de la perfección. Admitirlo es asumir la realidad que nos toca y aseguramos de estar a la altura de un momento en el cual las áreas de datos son críticas para el negocio”, finaliza Watson.

Para más información y consejos sobre cómo implementar DataOps en Databricks les recomendamos este webinar.

Redacción BDM

TE PUEDE GUSTAR

OpenAI lanza Codex, su primer agente especializado en ingeniería de software

Aldana Balmaceda
19/05/2025

OpenAI ha presentado el pasado viernes una vista previa de investigación de Codex, un agente de inteligencia artificial diseñado específicamente para tareas de ingeniería

Nuevo informe los sectores más impactados por la IA agéntica

Aldana Balmaceda
19/05/2025

En los últimos años, la IA y la automatización han sido las protagonistas indiscutibles de la transformación tecnológica. Sin embargo, 2025 marca un nuevo

CDO Day 2025: Hacer grandes inversiones de IA, en una fase tan inmadura, puede ser contraproducente

Aldana Balmaceda
18/05/2025

Chief Data Officer Day, el congreso de referencia para los profesionales del dato, organizado por IKN Spain, regresa con más fuerza que nunca para

La IA ya es de todos: más de 13 millones de personas en España utilizan estas herramientas

Aldana Balmaceda
15/05/2025

Actualmente, la inteligencia artificial ya no es solo un recurso exclusivo de grandes corporaciones y de expertos en esta tecnología, sino que su uso

El 32 % de los trabajadores en España afirma utilizar herramientas de IA en su día a día laboral

Aldana Balmaceda
14/05/2025

Radar Digital Mutualidad, el centro de investigación digital del sector asegurador de Mutualidad, entidad aseguradora sin ánimo de lucro que ofrece soluciones para cubrir

La IA regulada redefine el futuro del marketing digital en las empresas

Aldana Balmaceda
14/05/2025

Con motivo del Día Mundial de Internet, knowmad mood, multinacional tecnológica de soluciones de transformación digital, reivindica el papel transformador de la Inteligencia Artificial

EVENTOS

CDO Day 2025: Hacer grandes inversiones de IA, en una fase tan inmadura, puede ser contraproducente

AI, Eventos

Bravent y Microsoft presentan «Fabric: From Zero to Hero», el evento clave sobre análisis de datos con Microsoft Fabric

Eventos

El auge de la inteligencia artificial y la aplicabilidad de las tecnologías, claves del Mobile World Congress 2025

Eventos, Inteligencia Artificial

Combinando el BIG DATA y la IA para impulsar el futuro

AI, Data, Eventos

Las empresas aumentarán sus presupuestos destinados a IA un 23% en 2025

Eventos

El 58% de los CIOs señala la IA generativa como una de sus principales prioridades

Eventos

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things