Entrevista a Israel Serrano, responsable del Sur de Europa de Scality que acaba de recibir una nueva patente estadounidense por su innovadora tecnología de protección de datos a hiperescala.
La última innovación que sienta las bases para una recuperación eficaz de los datos del ransomware. Israel Serrano, el responsable del Sur de Europa de la empresa nos cuenta la importancia de esta patente, las últimas tendencias del almacenamiento de objetos, casos de uso emergentes para objeto o si es mejor y para qué trabajar On-Prem vs Public Cloud.
Big Data Magazine (BDM): Antes de entrar en detalles y para aquellos que aún no están familiarizados con el almacenamiento de objetos, ¿Qué es y qué aporta de nuevo al sector? ¿Por qué las empresas deberían incorporarlo en su estrategia?
Israel Serrano (IS): El almacenamiento de objetos es una arquitectura que gestiona los datos como objetos a diferencia de otras tecnologías más antiguas que los tratan como una jerarquía de ficheros o como aquellas que gestionan un conjunto de bloques.
Cada objeto se compone de los datos propiamente dichos, así como una cantidad variable de metadatos que describen esos datos y un identificador global único. Se incorporan conceptos hasta ahora poco habituales como la “Durabilidad” que supone la capacidad de mantener los datos consistentes sin ningún tipo de corrupción. Hablamos en nuestro caso de 11 nueves de durabilidad que implica que si almacenas 10 millones de objetos puedes esperar perder uno cada 10.000 años.
Son estas características las que nos permiten almacenar una cantidad ingente de datos no estructurados, que como todos sabemos son aquellos que no tienen estructura interna identificable y que típicamente no se almacenan en formato de base de datos estructurado. Según la previsión de IDC para el año 2024 supondrán el 80% del total de 138ZB de datos generados.
BDM: ¿Cómo está siendo la incorporación de estas tecnologías en las organizaciones?
IS: Las organizaciones están empezando a hacer un uso masivo de estas tecnologías ya que les permiten mantener la información durante un largo periodo de tiempo estando accesible en todo momento a las aplicaciones que explotan esos datos
Aunque el almacenamiento de objetos ha demostrado ya sobradamente su valor en las áreas de archivado, backup de larga rentención, almacenamiento de imágenes (cabe mencionar especialmente la imagen médica), video vigilancia, etc. cada día aparecen más casos de uso, especialmente en el área del big data y el EDGE computing
Por último y debido a sus características técnicas, los sistemas de almacenamiento de objetos proporcionan un ratio valor/coste inmejorable, permitiendo a las organizaciones hacer viables modelos de negocio basados en datos que hasta ahora era impensable
BDM: ¿Qué aportan los Casos de uso emergentes para objeto (BI, ML, EDGE…)?
IS: Venimos de un histórico muy centrado en el almacenamiento de datos y en su larga retención debido entre otras cosas a su efectividad en costes
Cuando hablamos de Big Data, se da una situación muy similar. A priori no siempre es posible identificar si vamos a ser capaces de poder extraer información valiosa de los datos por lo que hacer el caso de uso económicamente factible tiene una gran dependencia del coste que supone implantarla. El almacenamiento de objetos es un habilitador ideal para este tipo de casos de uso tanto por su coste como por las características intrínsecas de su arquitectura, permitiendo a las aplicaciones enriquecer la información en los metadatos.
De igual manera el Machine Learning se aprovecha de estas características dotando a las aplicaciones de mayores capacidades de “entendimiento” de información que están manejando.
El EDGE es un caso muy interesante ya que, a priori, alguien podría pensar que no es ahí donde se dan las mayores necesidades de almacenamiento de información. Pensemos que la previsión es que el 10% de los datos globales serán generados por los más de 80Bn de dispositivos IoT. Además, las características de enriquecimiento de datos de contexto mediante los metadatos, así como la “portabilidad” intrínseca a estas tecnologías, hacen del almacenamiento de objetos una herramienta ideal para la gestión de la información en el EDGE.
Por último, es también imprescindible el uso de software de almacenamiento “ligero” que permita a las aplicaciones de EDGE acceder a los datos de manera local sin necesitar de hacerlos transitar por la red.
BDM: Que tal está funcionado ARTESCA, el producto que lanzaron hace apenas unos meses ¿Qué aporta de nuevo a los clientes? ¿Qué diferencias tiene con el ya consolidado producto de Scality, RING?
IS: Artesca ha tenido un excelente recibimiento por parte del mercado. Estamos viviendo una explosión de nuevos casos de uso para el manejo de la información. Este años pasado 2020 más de 59ZB de datos han sido generados en todo el mundo.
Hemos hablado del Big Data, el Machine Learning, el EDGE pero también tenemos todo un universo de aplicaciones desarrolladas nativas en cloud y una enorme cantidad de software empresarial que está moviéndose desde tecnologías legacy como fichero o bloque hacia el objeto y más concretamente usando el protocolo S3 para su acceso a la información.
Estas cargas de trabajo requieren de características especiales que deben implementar los almacenamientos de objetos y es justamente ahí donde ARTESCA juega un papel principal.
Más que hablar de diferencias yo diría que lo que hacen es complementarse perfectamente. RING es el producto que ofrece no sólo almacenamiento de objetos sino también un entorno para ficheros distribuidos y que permite la consolidación de múltiples cargas de trabajo diferentes con grandes necesidades de almacenamiento. ARTESCA está más orientado a la aplicación, desarrollado 100% en contenedores y orquestado por Kubernetes, responde las necesidades de los grupos de DevOps que trabajan justamente en ese tipo de tecnologías para desarrollar soluciones incluyendo las aplicaciones situadas en el EDGE.
BDM: En cuanto a On-Prem vs Public Cloud, ¿Cuál es tu recomendación?, ¿Dónde deben guardarse los datos y dónde deben ejecutarse los procesos de negocio?
IS: Donde el negocio considere que aporta más valor. Ese valor puede venir determinado por los costes, la facilidad de acceso, la regulación vigente, etc. También la necesidad de grandes capacidades de computación en momentos puntuales pero cuyos resultados necesitan ser “repatriados” a la infraestructura residente en las dependencias de la organización.
Lo que tenemos que hacer los desarrolladores de soluciones tecnológicas es ofrecer herramientas que permitan a las organizaciones la libertad de elección en función de dónde obtienen el mejor ratio coste/beneficio.
BDM: Scality acaba de recibir una nueva patente estadounidense por su innovadora tecnología de protección de datos a . ¿En qué consiste?
IS: La amplia experiencia de Scality en sistemas de ficheros distribuidos y almacenamiento de objetos ha dado lugar a una nueva patente que permite a los clientes recuperarse de cualquier desastre o ataque de ransomware que actualmente están ocurriendo cada 11 segundos en el mundo. Esta innovación supone proporcionar la base técnica para permitir Snapshots (instantáneas) a escala masiva, con la capacidad de capturar miles de millones de ficheros en una sola instantánea, superando la capacidad de los sistemas de archivos NAS tradicionales en órdenes de magnitud.
BDM: Por último, ¿Por qué el almacenamiento de objetos es ideal para entornos de big data?
IS: Porque si hablamos de Big Data, este tipo de procesos de negocio requieren escalabilidad prácticamente infinita, que el coste de la infraestructura no sea un impedimento para la implantación y explotación de esos procesos.
Que la tecnología sea capaz de enriquecer la información en los metadatos a medida que está siendo tratada por las diferentes aplicaciones y, por último, la inexistencia de una jerarquía de carpetas hace que la recuperación de los objetos sea mucho más rápida que en otro tipo de arquitecturas.
Son justamente estas, coste, escalabilidad, metadatos y recuperación rápida las características de los almacenamientos de objetos