Los datos impulsan la innovación y el progreso

Israel Serrano, responsable del Sur de Europa de Scality.

Todos los días se crean datos no estructurados a un ritmo cada vez mayor en una gran variedad de sectores. Algunos ejemplos son la industria del entretenimiento y la sanidad, así como grandes bancos y proveedores de servicios. Los datos no estructurados están creciendo más rápido que cualquier otro tipo de datos que nos rodea (el analista de la industria de TI Gartner sitúa el crecimiento en torno al 30-60% anual).

Los datos no estructurados representan ahora el 80% de los datos que hay que gestionar: Documentos, archivos de audio o vídeo, metadatos, geodatos o incluso datos de medicina digital. Los datos no estructurados son básicamente todos aquellos que no encajan perfectamente en las filas y columnas de las conocidas bases de datos relacionales.

Antes de que la nube se convirtiera en el centro del interés general, las empresas solían recurrir al llamado almacenamiento en bloque con el fin de gestionar los datos estructurados. El almacenamiento en bloque suele implementarse en una SAN (red de área de almacenamiento).Para almacenar datos y archivos no estructurados, así como para acceder de forma independiente y con poco esfuerzo, las empresas de la época anterior a la nube solían optar por el almacenamiento conectado a la red (NAS

El almacenamiento de objetos, por otro lado, es un modelo de almacenamiento más reciente que surgió hace algo más de veinte años, pero no ganó repentinamente una rápida popularidad hasta los servicios de nube pública como AWS S3 alrededor de 2006. Junto con el almacenamiento de archivos y bloques, el almacenamiento de objetos se ha vuelto cada vez más común en los centros de datos empresariales y se ha convertido en una solución fiable para almacenar cantidades muy grandes y dinámicas de datos no estructurados. El almacenamiento de objetos, archivos y bloques tiene cada uno sus propias interfaces o protocolos de acceso. El NAS cuenta con los populares protocolos de archivo NFS y SMB; más recientemente, las ofertas y servicios de almacenamiento de objetos han evolucionado en torno a la API de AWS S3.

El enfoque basado en objetos, inicialmente más centrado en los datos de archivo y ciertamente no asociado a la velocidad, es fundamentalmente diferente de los enfoques basados en bloques. El almacenamiento de objetos organiza los datos en contenedores lógicos. En la terminología de AWS S3, se denominan «buckets» (cubos). Dentro de los cubos se puede almacenar un número ilimitado de contenidos reales, denominados «objetos». Con el almacenamiento de objetos, la estructura jerárquica habitual del sistema de archivos (directorios y subdirectorios) se sustituye por una estructura simple y plana, también conocida como espacio de nombres de objetos. Esta jerarquía plana permite un acceso uniforme a miles de millones de objetos.

En la mayoría de las soluciones modernas de almacenamiento de objetos «scale-out», la capacidad de almacenamiento puede ampliarse fácilmente añadiendo más recursos a nivel de petabytes (y más allá). Por el contrario, las soluciones tradicionales de almacenamiento basadas en archivos, como las plataformas NAS, muestran claras limitaciones a la hora de escalar a medida que aumenta el número de archivos.

Por esta razón, suelen ser adecuados para un número más manejable de archivos y capacidades totales más pequeñas. El almacenamiento en bloque, en cambio, tiene sentido para los datos en un contexto estructurado. Es ideal para el acceso aleatorio a pequeños conjuntos de datos, por ejemplo, los sistemas de base de datos.

Debido a sus claros puntos fuertes (simplicidad, eficiencia, rentabilidad, escalabilidad, etiquetado de metadatos), no es de extrañar que los enfoques basados en objetos hayan empezado a dominar rápidamente las principales cargas de trabajo. Ahora el almacenamiento de objetos también es capaz de soportar soportes flash, añadiendo el alto rendimiento a la lista de ventajas. El almacenamiento de objetos es la mejor opción de almacenamiento en la nube en el contexto de los datos no estructurados porque es elástico y flexible, y además se escala con mayor facilidad, hasta cientos de petabytes y más.

Estas son las razones que hacen que el almacenamiento de objetos sea especialmente atractivo para los casos de uso emergentes en el área del EDGE. Un dispositivo de EDGE es el lugar donde se recogen los datos: puede ser un teléfono móvil, un coche, un frigorífico o cualquier dispositivo conectado a través del Internet de las Cosas (IoT). Aquí es donde gestionar el crecimiento dinámico de los datos y el acceso rápido cerca de donde se originan los datos es tan importante. En los entornos de EDGE, los sistemas SAN y NAS son inflexibles y a menudo incompatibles con estos casos de uso específicos en mente, ya que las aplicaciones requieren inherentemente APIs amigables con la nube como S3 de forma nativa.

El almacenamiento de objetos pasa a primer plano desde la perspectiva de la industria y de los proveedores especialmente para las aplicaciones que capturan grandes flujos de datos desde una variedad de dispositivos móviles. En la actualidad, esto incluye flujos de eventos de todo tipo, así como sus protocolos, pero también datos de coches conectados y datos de imagen y vídeo del sector médico del IoT.

Estas aplicaciones se desarrollan de forma nativa en la nube y utilizan protocolos RESTful de almacenamiento de objetos como Amazon S3. Estas aplicaciones se desarrollan de forma nativa en la nube y están orientadas a los protocolos RESTful de almacenamiento de objetos.

El almacenamiento de objetos en soportes Flash se está convirtiendo en la opción óptima para dar soporte a esta creciente clase de aplicaciones centradas en los datos.

Dado que muchas empresas todavía están en proceso de pasar gradualmente a la nube, necesitan soporte de almacenamiento de datos tanto para las aplicaciones tradicionales -heredadas- como para las modernas en la nube.

Las soluciones que unifican los protocolos de almacenamiento de archivos y objetos en la misma plataforma de almacenamiento están resultando cada vez más útiles, especialmente en lo que respecta a los datos generados por máquinas, las técnicas modernas de análisis y los requisitos ad hoc de alto rendimiento informático. Por lo tanto, la convergencia entre el archivo y el objeto es un factor clave en este caso, ya que facilita la reutilización de los datos y limita la posible degradación del rendimiento a una sola aplicación.

En nuestro caso nos centramos en el almacenamiento, la protección y la gestión de grandes cantidades de datos no estructurados tanto en las instalaciones físicas de las organizaciones como en las nubes públicas. Nuestro producto estrella, actúa como una solución de almacenamiento integrada que combina de forma nativa el almacenamiento de archivos y objetos, a la vez que es compatible con nubes públicas y despliegues locales.

Cuanto más rápido puedan procesar los datos las empresas hoy en día, más rápido podrán tomar decisiones empresariales clave. El rendimiento es, por tanto, un argumento importante para alejar el procesamiento de datos de los centros de datos tradicionales y acercarlo a la nube pública. La capacidad de acelerar el procesamiento de datos, así como la transferencia de los mismos, es prácticamente esencial para aprovechar al máximo la computación de EDGE. La clave de la velocidad es eliminar cualquier dependencia de las redes de alta latencia.

La tecnología siempre ha jugado un papel clave en la historia de la exploración espacial. Como ejemplo paradigmático, la estación del INTA en Robledo de Chavela, en 1969, fue la primera en retransmitir la llegada del hombre a la Luna. Cincuenta años más tarde el INTA se enfrenta a nuevos retos científicos y tecnológicos.

En INTA cuenta con la tecnología de virtualización distribuida multisite Scality Ring que asegura la supervivencia de proceso de almacenamiento definido por software para el despliegue de nuevos procesos distribuidos

En el contexto del crecimiento explosivo de los datos no estructurados y las claras ventajas que ofrece el almacenamiento de objetos moderno a gran escala, especialmente para los requisitos de alto rendimiento, este tipo de almacenamiento tiene el potencial de cubrir una gama aún más amplia de cargas de trabajo en el futuro. La demanda y el mercado son muy dinámicos. El viaje sigue siendo emocionante.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio