Los open data o datos abiertos del Laboratorio Europeo de Física de Partículas (CERN), donde se descubrió el bosón de Higgs, ya están accesible desde hoy en la web opendata.cern.ch de la organización, que los pone a disposición de todo el mundo. Por primera vez la información sobre las colisiones reales producidas en el LHC se ofrecen a los científicos y la comunidad educativa.
\’Lanzar el portal Open Data del CERN es un paso importante para nuestra organización. Los datos del programa del LHC están entre los activos más valiosos de los experimentos del LHC, que hoy comenzamos a compartir de forma abierta con el mundo. Esperamos que estos datos abiertos ayuden e inspiren a la comunidad investigadora de todo el mundo, incluidos estudiantes y ciudadanos\’, dice el director general del CERN Rolf Heuer.
El principio de apertura está contenido en la Convención fundacional del CERN. Todas las publicaciones del LHC se han realizado en acceso abierto (Open Access), de tal forma que todos las pueden leer y usar. Ampliando el alcance de estas medidas, las colaboraciones de los experimentos del LHC aprobaron recientemente políticas de datos abiertos (Open Data) y ofrecerán los datos de las colisiones en los próximos años.
Los primeros datos analizables de alto nivel de colisiones ofrecidos en abierto proceden del experimento CMS, y fueron tomados en 2010 durante el primer ciclo de funcionamiento del LHC. Este conjunto de datos está disponible ahora en abierto en el portal Open Data del CERN, donde también se encuentran disponibles programas de código abierto (open source software) para leer y analizar los datos. La colaboración CMS se ha comprometido a liberar sus datos a los tres años de su obtención, después de que hayan sido estudiados minuciosamente por la colaboración.
\’Todo esto es nuevo para nosotros, y tenemos curiosidad por ver cómo los datos se volverán a utilizar de nuevo\’, señala la coordinadora de preservación de datos de CMS Kati Lassila-Perini. \’Hemos preparado herramientas y ejemplos de diferentes niveles de complejidad, desde análisis simplificados hasta aplicaciones en línea ready-to-use (listas para usar). Esperamos que estos ejemplos estimulen la creatividad de los usuarios externos\’.
Contribución española a la iniciativa Open Data
La contribución española a la iniciativa de Open Data del CERN es muy relevante. Fue la investigadora del Instituto de Física de Cantabria (IFCA, CSIC-UC) Teresa Rodrigo quien, como presidenta del consejo de la colaboración CMS, impulsó la elaboración de la política de publicación de datos de CMS en abierto.
En el desarrollo e implementación de esta política han contribuido Jesús Marco (IFCA) y Alicia Calderón, investigadora Ramón y Cajal de la Universidad de Cantabria que desde junio es responsable de estas actividades en CMS junto con Lassila-Perini. Por su parte, la investigadora del IFCA Ana Rodríguez ha colaborado en el desarrollo del portal y el software de análisis de varios ejemplos de física de CMS. El IFCA ha desarrollado también la web cmsopendata.ifca.es donde se ofrecen estos datos en abierto con fines educativos.
El portal de Open Data del CERN ofrece acceso a conjuntos de datos de eventos adicionales de las colaboraciones ALICE, ATLAS, CMS y LHCb, preparados específicamente con propósitos educativos como las masterclasses internacionales en física de partículas, donde cada año participan más de 10.000 alumnos de educación secundaria de todo el mundo, entre ellos medio millar de españoles mediante talleres en ocho centros de investigación de nuestro país. Estos recursos están acompañados por herramientas para visualizar los datos.
\’Nuestra propia política de datos prevé que estos se preserven y compartan. Hemos comprobado que los estudiantes están fascinados por ser capaces de analizar datos del LHC, por lo que estamos encantados de dar los primeros pasos y ofrecer algunos datos seleccionados para el ámbito educativo\’, apunta Silvia Amerio, coordinadora de preservación de datos del experimento LHCb.
\’El desarrollo de este portal Open Data supone el primer hito en nuestro objetivo de servir a nuestros usuarios preservando y compartiendo sus materiales de investigación. Así se asegurará el acceso y uso de los datos y las herramientas, ahora y en el futuro\’, asegura Tim Smith, del departamento de Tecnologías de la Información del CERN.
Todos los datos del portal Open Data del CERN están compartidos mediante una certificación de dominio público Creative Commons CC0; a los datos y el software se les han asignado identificadores digitales (DOI) para que se puedan citar en artículos científicos, como es habitual en este ámbito; y los programas informáticos se ofrecen con licencias de código abierto (open source). El portal Open Data del CERN se ha creado con software de código abierto de Invenio, que proporciona otras iniciativas y herramientas de ciencia abierta del CERN.