Actualidad, BigData-Pedia, Sin categoría

¿Qué es el Data Warehouse?

Se le conoce también con otros nombres como staging área, que significaría poner todos los datos operativos juntos, o the information warehouses, el nombre que se empezó a utilizar al referirse a este término en IBM y otros vendedores.

Un data warehouse es un proceso para guarda grandes cantidades de datos que han sido recopilados e integrados de múltiples fuentes. Principalmente, es el núcleo del sistema de BI creado para el análisis de datos y la generación de informes.

La definición universal de este concepto pertenece al que es considerado su padre, Bill Inmon, y la hizo en los 80: «es una colección de datos, orientados a un tema, integrados, variantes en el tiempo y no-volátiles utilizados en las estrategias de toma de decisiones”.

Los beneficios de un data warehouse son:

Mejor toma de decisiones
Consolida datos de muchas fuentes.
Calidad, consistencia y precisión de los datos.
Inteligencia histórica
Separa el procesamiento analítico de las bases de datos transaccionales, mejorando el rendimiento de ambos sistemas.

Historia del data warehouse

En 1960, Dartmouth y General Mills comenzaron un proyecto de investigación conjunta donde desarrollaron los términos dimensiones y hechos. Después, en el 1970, llegaron Nielsen e IRI, quienes introducen los data marts para las ventas de minoristas. Aunque, lo más importante en los 70 fue la aparición del concepto data warehouses de la mano de Inmon Bill; en el 1992 escribió el libro Building the Data Warehouses.

Tera Data Corporation en 1983 presentó un sistema de gestión de bases de datos que estaba específicamente diseñado para el soporte de decisiones. A finales de la década de 1980 comenzó realmente el almacenamiento de datos cuando Paul Murphy y Barry Devlin de IBM desarrollaron el Business Data Warehouse.

Características del data warehouses

Los data warehouses están enfocados principalmente para las empresas y harán uso, dentro de ellas, múltiples departamentos o muchas compañías o subdivisiones.

El diseño de estos tiene que ser tan resistente al cambio como fuera posible. Es un tipo de almacenamiento de datos masivos, por lo que uno de sus objetivos cuando se desarrolla es evitar que año tras año haya que descargar todos los datos, rediseñar la base y volverlos a cargar. Cuando se realiza el diseño hay que pensar en términos de procesos independientes, aplicaciones independientes y modelos de datos independientes de la tecnología de BI.

Cuando se crean estas bases de datos, también, hay que tener en cuenta que se haga con un mínimo de redundancia o duplicados de atributos o entidades. La mejor forma de hacerlo sería empleando técnicas de paralelización, carga de datos por bloque y API’s nativos.

Otra de las características que tiene que tener toda buena data warehouses es poseer un formato que ofrezca la posibilidad de permitir el análisis de muchas o todas las tecnologías de Business Intelligence.

Database vs data warehouses

Las principales diferencias que encontramos entre estos dos modelos son:

El Data warehouses recopila datos de diferentes fuentes y los homogeniza, mientras que las dabase recoge datos de un único origen.
El data warehouses recopila datos en cronogramas predeterminados, mientras que la data base los recoge en tiempo real.
En la normalización de datos los data warehouses lo hace como los esquemas Star o Snowflake, y la data base utiliza esquemas estáticos con alto nivel de normalización.

Data Lake vs data warehouses

Las principales diferencias entre estos dos modelos son:

Los data lake recogen datos no relacionados que provienen de dispositivos con IoT, sitios web aplicaciones móviles, redes sociales y aplicaciones corporativas. En cambio, los data warehouses tienen datos relacionados provenientes de sistemas transaccionales, bases de datos operativas y aplicaciones de línea de negocio.
Los data warehouses se diseñan con anterioridad, mientras que los data lake son de esquema de lectura.

6 data warehouses en el mercado

Snowflake
Terradata
Oracle
AWS
Cloudera
MarkLogic

Georgina Ortíz

TE PUEDE GUSTAR

El uso no laboral de la IA crece hasta el 73%

Aldana Balmaceda
22/04/2026

En el último año la relación con la inteligencia artificial ha cambiado, pasando de ser una herramienta propia y casi exclusiva del entorno laboral

La arquitectura se reinventa como startup con la irrupción de la IA y la impresión 3D

Aldana Balmaceda
21/04/2026

La digitalización está abriendo nuevas oportunidades de emprendimiento en el sector de la arquitectura y construcción, con startups que combinan diseño, tecnología y nuevos

IA industrial y robots móviles: Dassault Systèmes impulsa la fábrica del futuro en Hannover Messe

Aldana Balmaceda
21/04/2026

Dassault Systèmes participa un año más en Hannover Messe, que se celebra del 20 al 24 de abril de 2026, para mostrar cómo la

La adopción de IA se duplica en España y acelera la transformación empresarial

Aldana Balmaceda
20/04/2026

La humanidad atraviesa un momento de transformación sin precedentes. Learning Heroes, el mayor centro universitario online en español especializado en tecnologías disruptivas, identifica cinco tecnologías clave

La IA impulsa los recursos humanos: un mercado que se cuadruplicará hasta 2030

Aldana Balmaceda
19/04/2026

El tamaño del mercado mundial de la IA en el ámbito de los recursos humanos alcanzó los 3.250 millones de dólares en 2023 y

IA agéntica en el automóvil: Bosch da el salto hacia vehículos que piensan, actúan y se anticipan al conductor

Aldana Balmaceda
16/04/2026

Bosch acelera su estrategia de movilidad definida por software situando la Inteligencia Artificial agéntica en el centro de la evolución del coche del futuro.

EVENTOS

La IA inunda la construcción: desde la inversión hasta la planificación pasando por la digitalización de licencias

AI, Eventos

La IA amplifica los sesgos de género para las jóvenes: más frágiles, dependientes y con vocación a la salud

IA en femenino, Inteligencia Artificial

Convertir datos en impacto real

Eventos

Samsung impulsa la IA doméstica con ecosistemas abiertos en CES 2026

Actualidad, Eventos

Samsung presenta su Filosofía AI en el CES 2026

AI, Eventos

El CAIO Day reúne en Madrid a 330 líderes de IA y confirma el auge del nuevo rol estratégico en las empresas

Eventos, Inteligencia Artificial

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things