• UABDivulga
12/2007

Manuel Delfino, director del Port d'Informació Científica

Manuel Delfino

"La tecnología GRID ya ha demostrado su utilidad a los investigadores, pese a no estar todavía plenamente consolidada"

Manuel Delfino es director del Port d'Informació Científica (PIC), un centro tecnológico participado por la Universitat Autònoma de Barcelona (UAB), el Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas (CIEMAT), la Generalitat de Cataluña y el Instituto de Física de Altas Energías (IFAE), ubicado en el campus de la UAB. En la siguiente entrevista, Manuel Delfino nos explica qué es la tecnología GRID y qué ventajas implica para la investigación de muchas disciplinas que requieren almacenar un elevado volumen de datos.

Manuel Delfino es licenciado en Matemática Aplicada, Ingeniería Mecánica y Física por la Universidad de Wisconsin (EE.UU.)(1977), Máster en Física (1979) y Doctorado en Física con especialización en informática (1985). Con su tesis doctoral, realizada utilizando el Accelerador Lineal de Stanford, encontró la primera evidencia de la interacción débil entre el electrón y el positrón. Como parte de su tesis, también contribuyó a la técnica de instrumentación Calorimetría Gaseosa para detección de partículas.
Especializado en computación científica aplicada, ha participado en los proyectos IFAE-FALCON (1987-1992) y CERN-RD-47 (1993-1995), pioneros en la utilización de "granjas" de ordenadores para procesar datos científicos.
A lo largo de su trayectoria profesional, ha sido investigador de Supercomputer Computations Research Institute (EUA) (1993) y director de Tecnologías de la Información del CERN (1999). Actualmente es director del Por d'Informació Científica y catedrático de Física de la UAB.

Manuel Delfino dirige el Port d'Informació Científica (PIC) desde el año 2003, fecha en que se creó, estrechamente vinculado al proyecto Large Hadron Collider (LHC), el acelerador de partículas más grande del mundo, ubicado en el Laboratorio Europeo para la Física de Partículas (CERN), en Suiza. Este acelerador tiene como objetivo reproducir condiciones similares a las que se produjeron en el Big Bang, para estudiar los orígenes de la materia. Está previsto que entre en funcionamiento a mediados de 2008, pero ya se han empezado a realizar las primeras simulaciones.

Paralelamente a la creación del LHC y del PIC, se ha ido desarrollando la tecnología GRID, que permite repartir el almacenamiento de este volumen ingente de datos emitidos por el LHC por todo el mundo y que, a la vez, puedan ser accesibles para los investigadores desde cualquier punto del planeta. Se trata de una tecnología que ha demostrado también su utilidad en otras disciplinas, como por ejemplo la biomedicina o la cosmología, y con un futuro muy prometedor para la investigación.

El PIC forma parte de la primera corona de once centros -europeos, norteamericanos y asiáticos- encargados del almacenamiento y el procesamiento de los datos emitidos por el LHC y de su posterior distribución a una segunda corona de centros, repartidos por los cinco continentes, que a su vez proporcionan estos datos a los miles de investigadores de la física de partículas de todo el mundo. En este momento, la capacidad de almacenamiento del PIC es de unos 300 terabites, pero está previsto que supere los 1.000 terabites en los próximos meses.

- ¿Cuál es la principal ventaja de la tecnología GRID?

- La estructura GRID la entendemos como una plataforma que tiene su similitud con la red eléctrica mundial, que parte de unos centros emisores de datos principales y que, en forma de racimo, acaba llegando a los ordenadores personales de los investigadores. El sistema GRID nos permite almacenar un volumen de datos muy importante en varios centros repartidos por todo el mundo, hacer un procesamiento de los mismos y, posteriormente, proporcionar, de manera global, a cada investigador, los datos que requiere para su investigación. De esta manera, se agiliza enormemente el trabajo del investigador.

- Pónganos un ejemplo de su funcionamiento

- El acelerador de partículas LHC, por ejemplo, genera primero unos datos que son procesados. Es decir, los detectores del LHC nos proporcionan puntos del espacio por donde pasan las partículas, pero al investigador físico le interesan especialmente las trayectorias por donde pasan estas partículas. Por lo tanto, se da un proceso de reconstrucción para trazar la trayectoria de estos puntos, que pueden tener miles de trayectorias. Los ordenadores tratan esta información en bruto del detector de partículas y la transforman en información útil para el análisis científico. En una segunda parte, los mismos investigadores seleccionan cuáles son los datos que quieren analizar, mediante un proceso de filtrado del total de datos disponibles, para establecer sus hipótesis de investigación.
Este proceso no es único para la física de partículas. Una máquina de resonancia magnética, por ejemplo, produce unas medidas en puntos para representar el espacio dentro de nuestro cerebro y el proceso de reconstrucción transforma estos puntos en una serie de datos útiles para los radiólogos. Si se acumulan muchas resonancias magnéticas de muchos pacientes diferentes, un radiólogo puede elegir cuál es el criterio que quiere establecer para filtrar el total de resonancias disponibles y obtener sólo aquellas que se ajusten a unos determinados parámetros. Esto le permitirá establecer teorías e hipótesis sobre diferentes alteraciones cerebrales.

- ¿Qué áreas de conocimiento se pueden beneficiar?

- Aunque el primer objetivo del PIC fue el tratamiento de los datos del CERN y del LHC, se tuvo también presente que esta infraestructura pudiera ser útil a otras áreas de la ciencia. Actualmente estamos trabajando con ingenieros mecánicos, cosmólogos, astrofísicos y médicos, no sólo para reutilizar la capacidad de tratamiento de datos, sino también la filosofía que implica la tecnología GRID, de trabajar en grandes proyectos internacionales.
Por ejemplo, para estudiar la enfermedad de Huntington encontramos que hay investigadores en Alemania, Reino Unido, Italia y España, -en el Hospital de la Santa Creu i Sant Pau-, que tienen todos muchos datos de sus investigaciones, pero que necesitan ponerlos en común para compartirlos y trabajarlos globalmente, de cara a obtener mejores resultados en investigación. Aquí tiene una utilidad real el sistema GRID, porque permite trabajar a un conjunto de científicos que están dispersos globalmente, pero que se conceptualizan a ellos mismos como un único grupo o un único proyecto. Mediante servicios de software y acuerdos de identificación de usuarios, como por ejemplo un DNI electrónico para investigación aceptado mundialmente, se conectan a centros discretos de procesamiento de datos, que son los centros que dan servicio al GRID.
Esta infraestructura permite que un centro, como por ejemplo el PIC, no sirva sólo en España o en Cataluña, o a un solo proyecto. El propio centro es parte del sistema GRID y los equipos de investigación son organizaciones virtuales dadas de alta en el GRID, que pueden usar los datos almacenados en todos los centros que estén en red para un proyecto en concreto, aunque estén en la otra punta del mundo.

- ¿Como están acogiendo los investigadores esta nueva tecnología?

- La prueba de fuego del sistema GRID todavía ha de llegar, porque toda tecnología innovadora requiere un periodo de adaptación por parte de los humanos, que está calculado que sea de unos diez años, y que permitirá que este proyecto, que empezó con carácter estacional y temporal, se convierta en una realidad constante y permanente. Pensamos que la GRID europea será una realidad consolidada plenamente entre los años 2009 y 2010.
Por otra parte, debemos tener en cuenta que el científico sólo utiliza algo, en este caso una tecnología, si le sirve para mejorar su investigación. Yo considero que la tecnología GRID ya está demostrando su utilidad a los investigadores, pero se tiene que dar todavía un margen de tiempo para su aceptación entre la comunidad investigadora.

- ¿Quién puede ser usuario del PIC?

- Elegimos a los usuarios en función de los siguientes criterios: excelencia en la investigación, que esta investigación se haga en un contexto internacional y que se generen datos en cantidad suficiente como para no poder ser gestionados por los medios estándares.

- ¿Y los investigadores deben pagar por los servicios ofrecidos?

 - Los investigadores usuarios del sistema GRID pueden acceder a los datos para su investigación desde diferentes centros de almacenamiento. El sistema GRID les permite saber el coste que les supone obtener los datos de cada centro donde estén disponibles y pueden elegir el que les suponga el coste mínimo. En el PIC, por ejemplo, hay investigadores de otros centros que nos piden datos. Y también los investigadores de Cataluña piden acceso para utilizar los otros centros de datos a cambio.
Existe una contabilidad global donde cada mes vamos midiendo, de manera estadística, el volumen de servicios que damos a cada investigador, para ajustar los costes de los centros y crear una clase de mercado de procesamiento de datos. La nuestra no es una plataforma para investigar sobre GRID, es una GRID de producción. Si paramos la GRID, el Large Hadron Collider y otros proyectos dejarán de funcionar. Por ello, con financiación europea, hemos organizado Europa en una serie de regiones, y en cada lugar vertebramos un centro de operaciones, que asegura que esta infraestructura se mantenga coherente dentro la región y habla con los otros centros de control de las otras regiones. Este proyecto, denominado EGEE (Enabling Grids for E-sciencE), implementa todos los servicios de software que ofrecemos.

- ¿Como se financia el PIC?

- Tenemos un presupuesto base, a fondo perdido, que es precisamente el que genera el valor añadido que el investigador viene a buscar, es decir, ofrecemos una excelente infraestructura física y una base humana que vela por el buen funcionamiento del sistema. Parte del presupuesto base se destina también a equipamientos y nos permite realizar proyectos piloto para incorporar nuevas áreas de investigación. También participamos en proyectos conjuntos con los investigadores y pedimos financiación para todas las necesidades de almacenamiento y registro de datos del proyecto que presentamos. La suma de toda esta infraestructura beneficia a todos los investigadores que utilizan el PIC y, en promedio, cada investigador se beneficia de la inversión realizada y de este valor añadido del que hablábamos.

- ¿El sistema GRID y la supercomputación compiten entre sí?

- No, en absoluto. Este dos sistemas no se  deben ver como incompatibles, sino más bien como complementarios. Además, esta tecnología permite trabajar tanto a los supercomputadores como a los centros de súper almacenamiento, como por ejemplo el PIC. Lo que pasa es que mientras un centro de supercomputación tiene muchas unidades CPU's que se pueden comunicar entre ellas muy rápidamente, en el sistema GRID este tipo de comunicaciones ni siquiera se dan, porque todos los "diálogos" ocurren entre los computadores y los almacenes de datos de que disponemos. Lo que hace el sistema GRID es tratar procesos en que a cada uno de los ordenadores se le asigna una parcela de datos y el ordenador es capaz de procesarlos sin necesidad de "hablar" de una manera explícita con el resto de ordenadores.

- ¿Todavía tiene futuro la supercomputación, pues?

- Seguro. Es más, ahora estamos viviendo un renacimiento de la supercomputación, puesto que los progresos tecnológicos han permitido construir ordenadores cada vez más grandes sin aumentar el consumo de energía eléctrica y la emisión de calor. El supercomputador Mare Nostrum, ubicado en el Centro Nacional de Supercomputación, es un excelente ejemplo, porque está construido de componentes estándares, que se benefician del progreso tecnológico y le han permitido cuadruplicar su potencia.
Estos supercomputadores permitirán unas simulaciones muy completas, por ejemplo, del cambio climático. Otro ejemplo: donde antes se podía simular menos de 1 mm de ancho de un ala de un avión, ahora se están simulando centímetros de estas alas. Esto genera una gran cantidad de datos, lo que implica que los supercomputadores no son ya tan diferentes de los detectores del LHC o del conjunto de máquinas de resonancia magnética y se convertirán en una fuente más de datos que habrá que almacenar. Si conseguimos que el usuario use el supercomputador con un DNI electrónico para investigación y acceda al PIC con este mismo DNI, todo el proceso será mucho más ágil y fácil.

- ¿Y cuando sucederá esto?

- Estamos a punto. Está funcionando pero no está desplegado en el día a día. Ahora hay una tecnología GRID de centro de procesos de datos, donde el LHC ha tenido una influencia fundamental, y hay una GRID de centros de supercomputación. Ambos sistemas utilizan estándares diferentes y ahora hemos de llegar a un acuerdo para unificarlos.

- ¿Entenderemos en el futuro la ciencia y la vida humana sin la computación?

- Yo diría que sin infraestructuras digitales ya no se entiende, y esto irá a más en el futuro, cuando desaparezca la fractura digital que hay en la sociedad actual, debido a que todavía hay personas de las generaciones anteriores al nacimiento de la World Wide Web que no se han acabado de integrar en el nuevo sistema de comunicación virtual. El ser humano ha sufrido una transición, en los últimos diez años, hacia una situación que no tiene vuelta atrás. Las siguientes generaciones no entenderán la existencia sin las redes de telecomunicación que hemos conseguido tener gracias al progreso tecnológico. Ahora, la gran novedad es que todos estamos interconectados y se da una personalización de la información. La web original tenía el defecto que sólo uno podía escribir la página y el resto leía. Hoy en día, el concepto de organizaciones virtuales permite, con un DNI electrónico, participar activamente y no sólo ser receptor de información, sino también emisor.

- ¿Qué le parece que la UAB organice este año el Año de la Computación?

- Es una muy buena idea, porque permite concentrar la atención sobre un tema de gran actualidad que tiene mucha incidencia, tanto en el ámbito de la investigación como en la vida cotidiana. Espero que las iniciativas que están previstas llevar a cabo acerquen las nuevas tecnologías y infraestructuras de comunicación a toda la comunidad universitaria y ayuden a entender mejor su importancia.

Entrevista: María Jesús Delgado
Foto: PIC

.

 
View low-bandwidth version