Actualidad

¿Por qué es crucial la rapidez al procesar los datos?

La rapidez en la gestión y el proceso de los datos es fundamental a la hora de actuar con rapidez y de poder tomar decisiones.

La forma en que los macrodatos aumentan de tamaño es a través de un flujo constante de datos entrantes. En entornos de gran volumen, esos datos llegan a velocidades increíbles, pero aún deben analizarse y almacenarse.

Hace menos de una docena de años, era casi imposible imaginar el análisis de petabytes de datos históricos utilizando hardware básico. Hoy en día, los clústeres creados a partir de miles de nodos son casi comunes. Las tecnologías de código abierto como Hadoop reinventaron cómo procesar de manera eficiente petabytes sobre petabytes de datos utilizando hardware básico y virtualizado, haciendo que esta capacidad esté disponible de manera económica para los desarrolladores de todo el mundo. Como resultado, surgió el campo de los macrodatos.

Una revolución similar está ocurriendo con los llamados datos rápidos. Primero, definamos datos rápidos. Los macrodatos a menudo se crean a partir de datos que se generan a velocidades increíbles, como datos de flujo de clics, datos de ticker financiero, agregación de registros o datos de sensores. A menudo, estos eventos ocurren de miles a decenas de miles de veces por segundo.

Los beneficios del big data se pierden si los datos nuevos y de rápido movimiento se vierten en HDFS, un RDBMS analítico o incluso en archivos planos, porque se pierde la capacidad de actuar o alertar en este momento, mientras las cosas suceden. La manguera contra incendios representa datos activos, estado inmediato o datos con propósito continuo. El almacén de datos, por el contrario, es una forma de mirar los datos históricos para comprender el pasado y predecir el futuro.

Actuar sobre los datos a medida que llegan se ha considerado costoso y poco práctico, si no imposible, especialmente en el hardware básico. Al igual que el valor en big data, el valor en datos rápidos se está desbloqueando con la implementación reinventada de colas de mensajes y sistemas de transmisión como el código abierto Kafka y Storm, y la implementación reinventada de bases de datos con la introducción de ofertas de código abierto NoSQL y NewSQL .

Capturando valor en los datos

La mejor manera de capturar el valor de los datos entrantes es reaccionar ante ellos en el instante en que llegan. Si está procesando datos entrantes en lotes, ya ha perdido tiempo y, por lo tanto, el valor de esos datos.

Para procesar datos que llegan a decenas de miles a millones de eventos por segundo, necesitará dos tecnologías: Primero, un sistema de transmisión capaz de entregar eventos tan rápido como ingresan; y segundo, un almacén de datos capaz de procesar cada artículo tan rápido como llega.

Sistemas populares

En los últimos años han surgido dos sistemas de transmisión populares: Apache Storm y Apache Kafka. Originalmente desarrollado por el equipo de ingeniería de Twitter, Storm puede procesar de manera confiable flujos ilimitados de datos a velocidades de millones de mensajes por segundo. Kafka, desarrollado por el equipo de ingeniería de LinkedIn, es un sistema de cola de mensajes distribuidos de alto rendimiento. Ambos sistemas de transmisión abordan la necesidad de procesar datos rápidamente.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

La IA revoluciona el SEO: caen las visitas web pese a las búsquedas

Aldana Balmaceda
09/07/2025

La revolución de la inteligencia artificial está transformando profundamente el ecosistema digital. Herramientas como ChatGPT y las nuevas funciones de búsqueda de Google están

La IA generará 3 millones de empleos: formarse es vital

Aldana Balmaceda
09/07/2025

La llegada de la Inteligencia Artificial (IA) ha revolucionado la industria a todos los niveles. Tanto para uso cotidiano como para el ámbito profesional,

El sector sanitario es el que más rápidamente está adoptando la GenAI

Aldana Balmaceda
08/07/2025

Nutanix, empresa de computación híbrida multicloud, ha presentado los resultados del estudio anual Enterprise Cloud Index (ECI) para el sector sanitario, analizando el progreso

El 96% de las empresas cree que la IA es una oportunidad de crecimiento para los empleados

Aldana Balmaceda
08/07/2025

La inteligencia artificial (IA) ha comenzado a integrarse como herramienta en las empresas y organizaciones, pero su despliegue aún está lejos de ser integral.

BBVA amplía su alianza con Google Cloud para innovar con IA

Aldana Balmaceda
07/07/2025

BBVA y Google Cloud han anunciado hoy la implantación de Google Workspace con Gemini en todas las operaciones del banco a escala global. Con

Transparencia y ética en la Inteligencia Artificial: un imperativo urgente

Aldana Balmaceda
06/07/2025

En el marco de su conferencia europea de referencia, Kaspersky Horizons, celebrada en Madrid del 30 de junio al 2 de julio de 2025,

EVENTOS

Transparencia y ética en la Inteligencia Artificial: un imperativo urgente

Eventos, Inteligencia Artificial

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things