De los datos a los metadatos: los retos del nuevo activo esencial para las organizaciones

Superado el punto álgido de adopción de nube pública por parte de muchas empresas, los expertos de Cloudera identifican que son muy pocas organizaciones las que confían todos sus datos a una única nube, bien sea pública o privada. El futuro para la mayoría de los responsables de datos será multi-nube e híbrido, según la compañía, que identifica una preocupación creciente entre estos perfiles directivos por garantizar que sus entornos de datos se consolidan bajo el formato de la interoperabilidad.

Según revelan los clientes de Cloudera, para ellos es de vital importancia analizar la información, independientemente del lugar en el que esté alojada y, si es posible, en tiempo real. Por otro lado, los expertos del proveedor de la única plataforma realmente híbrida para datos, analítica e IA, subrayan que la verdadera batalla ahora es por los metadatos, esenciales para hacer que los datos sean consumibles, reveladores y útiles, además de garantizar la seguridad y la gobernanza. Cloudera propone que, en lugar de mover o copiar datos, las empresas deben centrarse en unificar los metadatos para mejorar la eficiencia y reducir costes.

 

¿Qué retos plantean los metadatos?

 

Los metadatos están formados por la información adicional que no aparece a simple vista en un fichero, documento o imagen, como su fecha de creación y la ubicación geográfica.

Estos activos pueden clasificarse en operativos y de negocio. Los primeros facilitan que la información se dirija a los destinatarios correctos, incidiendo en la gobernanza y la privacidad. Mientras que los segundos proporcionan el contexto necesario para que los usuarios puedan encontrar y analizar fácilmente la información que buscan.

Teniendo en cuenta la coexistencia de los anteriores tipos de metadatos en entornos cada vez más híbridos, el reto reside en conseguir gestionarlos de forma conjunta para automatizar el análisis y escalar los proyectos empresariales derivados de ellos.

Tradicionalmente, la respuesta ante este desafío ha sido trasladar o copiar los datos de una fuente o sistema a otro. Sin embargo, este enfoque no es efectivo, ya que aumenta los costes y dificulta la escalabilidad.

 

La gestión eficaz del metadato

 

En primer lugar, se debe conseguir que los metadatos sean fácilmente reconocibles por cualquier usuario. Y conseguir que estén disponibles y sean interoperables cuando proceden de diferentes fuentes. En este sentido, la mejora de su calidad y precisión, resulta clave para garantizar una consulta eficiente de esta información.

Al mismo tiempo, teniendo en cuenta que determinados metadatos recogen información confidencial de la empresa que no debe ser compartida con terceros, es indispensable aplicar las políticas de seguridad y gobernanza adecuadas. Un aspecto que se vuelve más complejo cuando se opera en entornos híbridos.

La gestión de los metadatos resulta compleja, ya que se encuentran en diversos formatos: datos estructurados, no estructurados, contenido multimedia… Esto dificulta aún más su integración y estandarización.

La necesidad de una plataforma abierta y unificada

 

La solución reside en la implementación de arquitecturas modernas data lakehouse. A través de esta infraestructura, los equipos almacenan y gestionan los metadatos en origen, lo que elimina copias y réplicas y garantiza una visión coherente y precisa.

De esta forma, al garantizar que cada conjunto de metadatos esté correctamente clasificado e identificado, los usuarios pueden encontrar fácilmente aquello que buscan, incluso en extensos catálogos o “bibliotecas” de datos, sin que se pierda información por el camino. Esto se traduce en eficiencia y ahorro de tiempo y recursos empleados por los equipos.

Precisamente, una de las principales ventajas de los metadatos radica en facilitar esa búsqueda y recuperación de los datos principales que describen. Algo que cobra un papel cada vez más importante en los proyectos de Inteligencia Artificial Generativa. Pero para alcanzar esa eficiencia se debe disponer de los sistemas y arquitecturas adecuados.

Gracias a la popularización de los data lakehouse de código abierto, garantizamos que los metadatos estén siempre disponibles y sean fácilmente accesibles, independientemente de las plataformas y soluciones con las que operan las compañías. En plena era del Hybrid Cloud, el metadato plantea una batalla que solo podremos ganar a través de una gestión y gobernanza sólidas.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio
Resumen de privacidad

Las cookies y otras tecnologías similares son una parte esencial de cómo funciona nuestra web. El objetivo principal de las cookies es que tu experiencia de navegación sea más cómoda y eficiente y poder mejorar nuestros servicios y la propia web. Aquí podrás obtener toda la información sobre las cookies que utilizamos y podrás activar y/o desactivar las mismas de acuerdo con tus preferencias, salvo aquellas Cookies que son estrictamente necesarias para el funcionamiento de la web de BigDataMagazine. Ten en cuenta que el bloqueo de algunas cookies puede afectar tu experiencia en la web y el funcionamiento de la misma. Al pulsar “Guardar cambios”, se guardará la selección de cookies que has realizado. Si no has seleccionado ninguna opción, pulsar este botón equivaldrá a rechazar todas las cookies. Para más información puedes visitar nuestra Políticas de Cookies. Podrás cambiar en cualquier momento tus preferencias de cookies pinchando en el enlace “Preferencias de cookies” situado en la parte inferior de nuestra web.