Hace poco más de una década, alrededor del mundo se detonó una explosión de información digital que trajo implícita una crisis para albergar las grandes cantidades de datos. Se dice que en la actualidad, a diario se crean alrededor de 15 millones de gigabytes de información y se estima que llegue a un billón de gigabytes en 2020.
Frente al reto que representa para las organizaciones públicas y privadas preservar sus datos, en el seno del Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec) se creó el sistema de archivos Babel, una herramienta para el almacenamiento masivo.
Inspirados en el cuento La biblioteca de Babel, de Jorge Luis Borges, en el que se presenta una biblioteca que —se conjetura— podría ser infinita, los especialistas crearon este conjunto de dispositivos de almacenamiento y procesamiento que ofrece una administración eficiente de los recursos, confiabilidad, escalabilidad y latencia de servicio.
El doctor Ricardo Marcelín Jiménez, investigador externo de Infotec y de tiempo completo de la Universidad Autónoma Metropolitana (UAM), describe este instrumento que puede percibirse como un disco virtual con capacidad ilimitada, que está en servicio de manera continua para cualquier tipo de aplicación y al que se puede acceder vía web.
“Vamos a pensar que es una caja que puedes ver en la nube y sobre la que puedes hacer tres operaciones básicas: almacenar, buscar y recuperar archivos. Pero lo interesante es que detrás de esta caja hay funciones de integridad, disponibilidad, de tolerancia a fallas y confidencialidad de la información, entre otras”, dice a la Agencia Informativa Conacyt.
El proyecto surgió en este centro público de investigación del Consejo Nacional de Ciencia y Tecnología (Conacyt) dado el crecimiento exponencial de las necesidades de almacenamiento de muchas entidades públicas al ser su proveedor de soluciones, por lo que se invitó a especialistas de la UAM a participar en un convenio a través de un estudio de prospección.
“Se advirtió que si seguían utilizando las mismas tecnologías, habría un momento en que sería demasiado caro mantener la capacidad y el storage; fue así que se inició una línea de investigación para generar una solución propia de almacenamiento y eso dio como resultado Babel”, señala.
Herramienta a la medida
En entrevista, el doctor Ricardo Marcelín Jiménez señala que Babel se compone de un conjunto de nodos (máquinas con capacidades de almacenamiento y procesamiento) que se conectan a través de una red local formando un clúster.
De esta forma, los usuarios de Babel se comunican a través de una sola máquina —llamada coordinador o proxy— que despacha las solicitudes de servicio y administra los recursos.
“Los archivos se guardan de manera redundante, es decir, se crea un exceso en la información que codifica los archivos y este exceso se guarda de forma distribuida entre los diferentes dispositivos que componen el sistema”, detalla.
Este modelo de almacenamiento propone tomar ventaja de la infraestructura de una red de alta velocidad y ofrecer cómputo de altas precisiones a bajo costo, mientras se centraliza el control y manejo de recursos distribuidos mediante el uso de sistemas de virtualización.
El también integrante del Sistema Nacional de Investigadores (SNI) nivel I explica que el principal beneficio de este almacenamiento distribuido es que se logra la independencia de la información y el medio en que se aloja.
“Visto de otra forma, los archivos que se guardan en un repositorio colectivo no dependen de un solo dispositivo para su recuperación. De esta manera se ofrecen garantías de tolerancia a fallas y mejora la disponibilidad del sistema”, añade.
Además, el sistema tiene como característica la escalabilidad que le permite al usuario ir creciendo su capacidad; “su metodología de diseño lo asemeja a un Lego, porque se puede comenzar con un kit básico para armar un sistema funcional y en la medida en que se tienen necesidades mayores se puede expandir escalando módulos”, dice.
Marcelín Jiménez indica que otra ventaja es que se puede modificar y hacer un diseño a la medida de las necesidades de cada usuario.
Y es que, incluso, su diseño de compatibilidad le permite comunicarse con otros sistemas de software y protocolos como HTTP, WEB DAT, REST y FTP.
A la fecha, Babel es utilizado por diversas instituciones públicas, por el propio Infotec, la UAM y por el Laboratorio de Análisis Forense de Imágenes de la Escuela Superior de Ingeniería Mecánica y Eléctrica (ESIME) Culhuacán, del Instituto Politécnico Nacional (IPN).
Dr. Ricardo Marcelín Jiménez Doctor en ciencias de la computación. Investigador nacional nivel I. |