Para cualquier persona no entendida en materia de ingeniería informática o ciencias de la computación, llegar a un centro de datos implica descubrir a cada paso un escenario diferente. Grandes servidores, centenares de cables y otra buena cantidad de pequeños bombillos parpadeantes componen el panorama de cualquiera de estos lugares. Allí, tanta tecnología desconocida soporta prestaciones cada vez más básicas e imprescindibles, pero también otras que surgen y abren horizontes para el desarrollo científico de cualquier país.
Entre ellas, la computación de alto desempeño (HPC por sus siglas en inglés) representa una de las herramientas más importantes para la ejecución de simulaciones matemáticas complejas. La investigación moderna depende casi en absoluto de estos sistemas, y áreas tan distintas como la biología, los materiales de la construcción, las telecomunicaciones, o aspectos tan cotidianos como el parte meteorológico, le deben muchos de sus últimos avances.
Aunque desde hace años científicos y centros de investigación de la Isla utilizan estas técnicas, ahora una novedosa iniciativa busca interconectar los tres grandes centros de datos existentes en la nación y ofrecer una capacidad de cálculo nunca antes vista en Cuba. Sustentado a partir de la colaboración con el Consejo Interuniversitario de Universidades Flamencas de Bélgica y amparado en el empleo del software libre, el proyecto HPC Cuba pretende incidir de manera directa en el perfeccionamiento de la ciencia en el país.
La computación de alto desempeño posibilita una alta capacidad de cálculo y análisis de datos. Foto: Malú Vilasa.
La computación de alto desempeño y el surgimiento de HPC Cuba
La computación de alto desempeño (HPC por sus siglas en inglés) consiste en un conjunto de servidores que funcionan como una potente computadora, capaz de concentrar un gran volumen de cálculo y un elevado número de procesadores con grandes prestaciones de memoria RAM y almacenamiento. Estos sistemas permiten realizar millones de operaciones matemáticas o simulaciones muy complejas en un tiempo más corto que el empleado por los tradicionales ordenadores de escritorio, y por tanto disminuyen los tiempos de investigación.
“Con el HPC es posible terminar en pocos días o incluso horas una simulación que con ordenadores de escritorio o incluso con programas tradicionales demoraría más de una semana. Esto incide directamente en la velocidad de las investigaciones, pero también en la profundidad y en la cantidad de variables a analizar”, asegura Jorge Armando Portal Díaz, administrador de uno de los clústeres disponibles en el país
Según explica el joven ingeniero, estos sistemas utilizan técnicas como la Computación Paralela, una forma de cómputo capaz de dividir miles de cálculos en pequeños grupos y ejecutarlos de manera simultánea. Asimismo, las herramientas de big data permiten análisis de información imposibles con las bases de datos tradicionales, ayudan en la toma de decisiones y en la identificación de problemas. Sin embargo, a pesar de sus conocidas virtudes, estas prestaciones nunca dejaron de ser una tecnología de difícil acceso para los investigadores de la Isla.
El Dr. Héctor Cruz Enríquez, uno de los gestores de la novedosa iniciativa, recuerda cómo durante mucho tiempo las instituciones científicas cubanas debían administrar sus pequeños servidores para realizar los estudios, o incluso acceder a sistemas HPC ubicados en el extranjero si pretendían ejecutar simulaciones complejas o no poseían esa tecnología. “Esto traía una consecuente molestia con el ancho de banda y otras cuestiones organizativas o de permisos vinculados a la seguridad informática”, asegura.
Ante la situación, una alternativa estuvo en aprovechar las potencialidades instaladas y el desarrollo alcanzado por universidades nacionales y poner esas capacidades a disposición de la comunidad científica. Así surgió la idea de interconectar los campus ubicados en la Universidad de Ciencias Informáticas (UCI), la Universidad Central “Marta Abreu” de Las Villas (UCLV) y la Universidad de Oriente (UO) y crear un sistema integrado para el uso de esta tecnología.
“Lo novedoso del proyecto no radica tanto en el uso de una herramienta conocida por muchos investigadores, sino en la creación de una red nacional disponible para científicos de cualquier lugar del país. Asimismo, el considerable aumento de las capacidades instaladas, la incorporación de nuevos servicios como el big data y la utilización de equipamiento profesional para el cálculo o el almacenamiento de la información representan otras ventajas importantes”, aclara el Dr. Héctor Cruz.
Según dice el también Coordinador de la Red de Colaboración con las Universidades Flamencas de Bélgica, los primeros pasos del proyecto asociado a la computación de alto desempeño tomaron fuerza a partir del año 2011, sobre todo impulsados por la sólida relación de trabajo con la Universidad de Gante. De acuerdo al directivo, el primer paso en ese vínculo estuvo en reorganizar las capacidades existentes en los centros de educación superior, para luego comenzar en 2013 el proceso de transferencia tecnológica y la preparación de los investigadores cubanos sobre los modos de trabajar con los modernos equipamientos donados por el país europeo.
El Ing. Jorge Armando Portal Díaz es uno de los encargados de administrar el clúster de big data en la UCLV. Foto: Yunier Sifonte/Cubadebate
Mientras tanto, en la Universidad de Ciencias Informáticas y en la de Oriente ocurrió un proceso similar. De acuerdo al Dr. Fernando José Artigas Fuentes, Coordinador del Grupo HPC en la institución santiaguera, la computación de alto desempeño tuvo sus inicios allí en el año 2001 con tres pequeños equipos colocados en el Centro de Biofísica Médica. Luego llegaría otro para el Departamento de Química y más tarde, gracias también a la colaboración con Bélgica, lograron adquirir dos clústeres profesionales con una mayor capacidad de procesamiento.
Una vez consolidada esa primera etapa de transferencia tecnológica —tres caminos distintos que terminaron en un mismo punto— sobrevino un paso esencial: proponer la creación del proyecto HPC Cuba. La iniciativa estuvo amparada en el desarrollo conseguido por los especialistas cubanos en el manejo de esos sistemas, así como por aquella necesidad de llevar sus potencialidades a todos los investigadores de la Isla. Junto al asesor belga Dieter Roefs, la primera presentación oficial de la idea tuvo lugar durante el Congreso Internacional Universidad 2016 y recibió una considerable aceptación.
A partir de ese momento, se fortaleció el trabajo conjunto y los vínculos entre las universidades para compartir las mejores experiencias. Además, junto a la idea de unir en un proyecto nacional a los tres centros de datos líderes en el manejo de esta tecnología, surgió también la posibilidad de incorporar otros organismos externos al Ministerio de Educación Superior.
Entre esas instituciones sumadas, el Grupo Empresarial BioCubaFarma representa la primera de las entidades vinculadas al proyecto. Con un sistema propio y grandes perspectivas de crecimiento para el actual año, el grupo mantiene una cooperación constante y recibe apoyo de especialistas de la UCLV, sobre todo en el manejo de la tecnología y en el asesoramiento para la instalación de nuevas aplicaciones. Su objetivo tampoco varía: apoyar con sus capacidades al desarrollo científico de la nación.
De hecho, según dijo a Granma el Ing. Karel Asael Barberena, especialista principal de la dirección de infocomunicaciones de la Empresa de Tecnologías de la Información (ETI) y líder del proyecto HPC en BioCubaFarma, uno de sus propósitos radica en “contribuir a la informatización de procesos que se reviertan luego en una utilidad, ya sea científica o social”.
Supercomputadoras cubanas de cara al futuro
Los equipos donados por el Consejo Interuniversitario de Universidades Flamencas de Bélgica posibilitaron el desarrollo de esta tecnología. Foto: Malú Vilasa
Aun con sus amplias prestaciones y su capacidad para garantizar estudios científicos más complejos y abarcadores, uno de los grandes problemas de estas supercomputadoras radica en el desconocimiento de su existencia por buena parte de la comunidad científica nacional. Proyecto novedoso al fin, todavía necesita irrumpir en el panorama investigativo del país y desterrar temores y complejidades de usuarios para acceder a sus servicios.
Así, el Ing. Ernesto Eduardo Díaz Conde, administrador de HPC en la Universidad de Oriente, reconoce la necesidad de continuar el trabajo para que más centros de investigación se acerquen a las supercomputadoras. “Aunque logramos avances y el Instituto Metalúrgico de Moa y la Universidad de Ciego de Ávila resultan usuarios habituales, todavía quedan potencialidades por utilizar”.
En los clústeres ubicados en la UCLV ocurre algo parecido y solo los utilizaron alrededor de 36 centros científicos en el 2017, muy por debajo de la capacidad real. Asimismo, según los datos existentes en la página oficial de los servidores instalados en la UCI, su tecnología instalada generalmente tiene un uso entre un 65 y un 80 por ciento.
Para revertir esta situación —originada más por el desconocimiento que por el rechazo— los centros líderes articulan una estrategia enfocada cada vez más al trabajo conjunto. Unificar sus modos de hacer y crear las herramientas necesarias para lograr una efectiva relación entre las instituciones científicas de la nación y los centros de datos garantes de los servicios de computación de alto desempeño, resultan claves en ese propósito.
Para ello, por ejemplo, un pequeño equipo se encarga del desarrollo de aplicaciones y la puesta en marcha de un portal web nacional destinado a facilitar el acceso a los recursos de supercómputo de cualquiera de las instituciones asociadas al proyecto. Según el Lic. Victor Marrero Shimko, uno de los miembros de ese grupo, en la futura página cada usuario podrá elegir dónde realizar sus simulaciones, en dependencia de las características de la investigación, la necesidad de recursos informáticos o incluso el nivel de explotación de cada supercomputadora y el tiempo de espera necesario.
Para Marrero Shimko, esta resulta una herramienta imprescindible para organizar el proceso, gestionar con eficiencia todas las capacidades disponibles en el país y facilitarle el trabajo a los propios científicos.
“Parte esencial de nuestra función radica en instalar tecnologías que los usuarios no tienen necesariamente que conocer, porque no forman parte de sus campos de estudio. La interfaz web le ofrece una manera cómoda de correr sus cálculos sin preocuparse por esas aplicaciones y solo dedicar tiempo a definir el modo de ejecución y las variables a utilizar”, aclara el joven graduado en Ciencias de la Computación.
Según dice, el portal debe quedar listo para mediados del actual año, aunque ello depende en gran medida del avance de otros grupos de trabajo como el encargado de las redes o el vinculado a la administración y puesta a punto de los servicios habilitados en cada clúster. No obstante, aclara que sí están disponibles portales locales encargados de gestionar el acceso a los servicios tanto en la UCLV como en la UO y la UCI.
“Una vez lista la interface, ahora trabajamos en establecer puntos en común entre los centros asociados a la iniciativa, sobre todo para definir los lenguajes, las tecnologías o las aplicaciones a emplear y lograr un homogeneidad en todos ellos. No obstante, es imprescindible lograr el empuje inicial y sumar desarrolladores para compartir códigos y avanzar a una velocidad mayor“, agrega.
Los habituales contactos entre los grupos de trabajos encargados de los sistemas HPC contribuyen a avanzar hacia objetivos similares. Foto: Alejandro Peña/UO.
Por su parte, aun en su segundo año de adiestramiento, el Ing. Javier Antonio Ruiz Bosch es uno de los administradores del clúster de computación de alto desempeño en la UCLV. Vinculado a ese campo de estudio desde su etapa de estudiante de Ingeniería en Telecomunicaciones y Electrónica, el joven investigador reconoce las potencialidades de esta tecnología no solo para el desarrollo del país, sino también para la imprescindible autopreparación de los miembros del equipo.
“Más allá de los 80 nodos que ahora mismo tenemos en producción para la computación de alto desempeño y el big data, destinamos otros cuatro a la investigación y el desarrollo, y eso repercute en nuestra formación y en la realización de estudios para incidir en el manejo y los modos de trabajar con estos sistemas. Es algo así como una retroalimentación para mejorar siempre”, agrega.
Mientras tanto, el Dr. Fernando Artigas Fuentes, Coordinador del Grupo HPC en la Universidad de Oriente, reconoce la necesidad de ampliar los equipos de trabajo y potenciar la formación de nuevos especialistas en temas afines. “Pretendemos impartir un curso de Computación Paralela como parte de la Maestría en Ciencias de la Computación que acoge la universidad y seguimos otros procesos de capacitación para los especialistas interesados en el tema”, concluye.
Junto a la consolidación de iniciativas similares, el Dr. Hector Cruz enumera también otros desafíos importantes en el afán de llevar la computación de alto desempeño hasta la mayor parte de los centros científicos del país. Entre esos retos fundamentales, ubica la necesidad de aumentar la cultura de muchos investigadores en el uso de esta tecnología, “de forma tal que sean capaces de entender una amplia variedad de lenguajes de programación y adaptar los recursos disponibles a los objetivos de sus experimentos”.
“Utilizar un sistema HPC implica necesariamente aplicar técnicas de Computación Paralela. Si eso no ocurre la simulación tardaría casi el mismo tiempo que si se realiza en una buena computadora de escritorio. Muchas veces encontramos usuarios ajenos a estos conceptos que dejan de recurrir a un servicio capaz de facilitarle mucho su estudio”, explica.
Para enmendar esta situación, por ejemplo, los gestores de HPC Cuba abogan por insertar especialistas en el manejo de estos sistemas dentro de los grupos de investigación, de forma tal que puedan asesorarlos y explotar con eficiencia las capacidades de cálculo instaladas en el país. A su vez, pretenden consolidar programas de formación tanto a científicos como a graduados de carreras afines con la computación y la informática sobre el manejo y desarrollo de esta tecnología.
Asimismo, otros planes para los próximos meses radican en ampliar las capacidades de almacenamiento, facilitar los paquetes de instalación e incorporar nuevas aplicaciones para incrementar aun más las potencialidades de uso en diversos campos de la ciencia.
Con un buen camino recorrido, pero otro todavía mayor por desandar, la computación de alto desempeño gana espacio en el panorama científico de la nación y abre puertas a una tecnología imprescindible en el mundo contemporáneo. Más allá de un fin esencialmente académico, el uso de una herramienta como esta resulta vital para el fortalecimiento de nuestra estructura para la investigación.
Así, varias cuestiones parecen inalterables: un proyecto de este tipo le garantiza al país una necesaria soberanía tecnológica, mientras defiende conceptos como la democratización del acceso al desarrollo científico y permite la ejecución de estudios más competitivos y con un mayor valor agregado. El conocimiento de estos sistemas, la consolidación del vínculo entre los principales centros de datos, junto a la constante preparación de investigadores y administradores, resultan también puntos esenciales para que las supercomputadoras cubanas impacten con solidez en la producción científica nacional.