Catálogos de datos: qué son y para qué sirven en el mundo del Big Data

Se trata de catálogos que permiten gestionar mejor los datos que utiliza y que obtiene la empresa, además de conocer cómo están estructurados y permitir un acceso más rápido y seguro a los mismos.

Las bases de datos, los data lakes… todos ellos son importantes para insertar, actualizar, consultar, buscar y procesar datos. Sin embargo, la mayoría de plataformas de gestión de datos no proporcionan herramientas sólidas o interfaces de usuario para compartir lo que contienen. Son más como bóvedas de datos. Se sabe que en ellas hay datos valiosos, pero no hay manera de poder evaluarlos desde fuera.

Los expertos en gestión de datos coinciden en que uno de los desafíos empresariales del futuro es el poder lidiar con múltiples bases de datos empresariales, centros de datos, nubes, aplicaciones, herramientas de BI, API, hojas de cálculo y fuentes de datos abiertas.

Los ‘data catalog’ o catálogos de datos existen desde hace algún tiempo y se han vuelto más estratégicos en la actualidad a medida que las organizaciones escalan en el uso de plataformas de big data, operan en nubes híbridas, invierten en ciencia de datos y programas de aprendizaje automático.

Los catálogos de datos son herramientas para que toda la organización aprenda y colabore en torno a las fuentes de datos. Son importantes para las organizaciones que intentan estar más impulsadas por los datos, las que tienen científicos de datos que experimentan con el aprendizaje automático y otras que incorporan análisis en aplicaciones orientadas al cliente.

Ayudan a encontrar fuentes de datos

Los ingenieros de bases de datos, los desarrolladores de software y otros tecnólogos asumen la responsabilidad de integrar los catálogos de datos con las principales fuentes de datos empresariales. También utilizan y contribuyen al catálogo de datos, especialmente cuando se crean o actualizan bases de datos.

En ese sentido, los catálogos de datos ayudan a responder qué datos existen, cómo encontrar las mejores fuentes de datos y cómo proteger los datos. El catálogo de datos incluye herramientas para descubrir fuentes de datos, capturar metadatos sobre esas fuentes, buscarlas y proporcionar algunas capacidades de gestión de metadatos.

Muchos catálogos de datos van más allá de lo que sería un típico directorio. Los catálogos de datos a menudo incluyen relaciones entre fuentes de datos, entidades y objetos. La mayoría de los catálogos rastrean diferentes clases de metadatos, especialmente sobre confidencialidad, privacidad y seguridad. Capturan y comparten información sobre cómo diferentes personas, departamentos y aplicaciones utilizan las fuentes de datos. La mayoría también incluye herramientas para definir diccionarios de datos; algunos incluyen herramientas para perfilar datos, limpiar datos y realizar otras funciones de administración de datos.

A medida que las organizaciones obtengan más valor comercial sobre los datos que utilizan, tendrán una mayor necesidad de utilizar los catálogos de datos.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio