CERN (deel 1) – Het begin

Bonjour! Na maanden van papierwerk en geregel is het dan zover. Ik ben uitgekozen als Summer Student en ik mag bij CERN op de IT-DB (Information Technology – Databases) groep een project gaan doen! De stage duurt van 19 juni 2016 tot en met 19 augustus 2016 en tijdens het verblijf krijgen we rondleidingen, lectures over natuurkunde in juli en lectures over informatica begin augustus. Ook krijgen we de kans om ons project uiteindelijk te presenteren aan alle zomerstudenten en een postersessie te organiseren waar iedereen vragen kan stellen over het uiteindelijke resultaat.

Wat is CERN?

Een korte introductie van CERN voor degene die het niet weten: CERN is een grote organisatie waar men experimenteert met deeltjes. Ze laten de deeltjes door middel van deeltjesversnellers met hoge snelheid op elkaar botsen waarbij er (hopelijk) nieuwe deeltjes vrijkomen. Deze nieuwe deeltjes worden gemeten door detectoren. De grootste deeltjesversneller van CERN is de LHC (Large Hadron Collider). Op dit moment is het de grootste deeltjesversneller op aarde en bestaat uit een ring van ongeveer 27 kilometer! Er zijn in het verleden en zelfs recent nieuwe ontdekkingen gedaan. De meest recente grote ontdekking op het moment van schrijven is de ontdekking van het Higgs deeltje.

Aankomst

Een parkeerplaats voor het terrein van CERN.

Een parkeerplaats voor het terrein van CERN.

Op 19 juni was het dan zover. De vlucht van Amsterdam naar Genève met de KLM verliep zonder problemen. Bij aankomst was het bewolkt wat een beetje tegenviel. Na wat gepuzzel ben ik met de bus naar CERN gegaan om daar mijn sleutels voor mijn kamer op te halen. Het hostel bevindt zich op een half uur lopen van het CERN terrein. Je moet dan een flinke heuvel op, de grens over naar Frankrijk en dan de heuvel weer af. Het hostel ziet er prima uit! Enig minpuntje is dat de gang een beetje gehorig is, maar verder is het hartstikke goed geregeld.

Mijn kamer in het hostel.

Mijn kamer in het hostel.

Mijn project

Na de eerste nacht in het hostel was het dan zover! De eerste dag bestond vooral uit formaliteiten; we kregen een toegangspas, je kon een fiets regelen en na de middag kwamen we in contact met onze begeleider op CERN. Ik mocht naar de IT-DB groep, een groep gespecialiseerd in het opslaan en verwerken van grote hoeveelheden data. CERN heeft te maken met enkele Petabytes aan data. Ter vergelijking: een Word documentje is een paar MB. De data van CERN bestaat dus uit ongeveer 1.000.000.000 Word documenten! Dat is moeilijk voor te stellen. Een ander voorbeeld is de gehele internetcollectie. De data bij CERN is ongeveer 1.000 keer zo groot als de grootte van alle webpagina’s bij elkaar opgeteld.

Uitzicht vanuit het kantoorraam!

Uitzicht vanuit het kantoorraam!

Nadat ik mijn begeleider had ontmoet, kreeg ik te horen waar mijn project over ging. Op dit moment wordt Apache Spark veel gebruikt om berekeningen te doen op grote hoeveelheden data. Deze software werkt met batches; dat wil zeggen dat het even wat data verzamelt en dan op deze verzameling berekeningen uitvoert. Dit sluit niet helemaal aan bij de aard van de data die bij CERN voorkomt. De data bij CERN komt als een stroom van data binnen. Dit wordt ook wel streaming genoemd. Een recent project van Apache is Apache Flink. Deze software kan overweg met datastreams en is wellicht daarom meer geschikt voor CERN dan Apache Spark. In mijn project zal ik deze software gaan vergelijken en nagaan of Apache Flink geschikt is voor het CERN IT landschap.

Ik kreeg mijn eigen computer met twee monitors en de eerste dag bestond vooral uit het instellen van de software. De rest van de week bestond ook vooral uit het opzetten, maar dan van het cluster. Het minicluster bestaat uit 13 computers en heeft een grootte van ongeveer 3TB. Dat is erg klein vergeleken met het grote cluster van CERN dat een grootte heeft van enkele Petabytes, maar het is schaalbaar en het kan gebruikt worden om de data mee te simuleren.

Mijn computer op het kantoor.

Mijn computer op het kantoor.

Rondleidingen

We hadden vier rondleidingen in de eerste week. Twee op dinsdag en twee op donderdag. De eerste rondleiding op dinsdag aan het ATLAS visitor centre. Helaas konden we niet naar ATLAS zelf gaan, omdat er een experiment bezig was. Het was erg indrukwekkend om te zien waar het experiment allemaal uit bestaat en hoe alle componenten samenwerken. Ook kregen we een kijkje in de controlroom, waar natuurkundige alle componenten van ATLAS in de gaten kunnen houden. Elke computer in de controlroom is verbonden met één van de componenten van ATLAS.

ATLAS visitor centre.

ATLAS visitor centre.

Daarna gingen we naar de Synchrocyclotron. Hier werden in de beginjaren van CERN (na 1954) enkele succesvolle experimenten uitgevoerd. In deze deeltjesversneller kon met deeltjes versnellen tot 80% van de lichtsnelheid. Tegenwoordig worden de resultaten gebruikt in de medische wereld; protonen worden gebruikt voor het bestrijden van kanker.

De synchrocyclotron.

De synchrocyclotron.

De donderdag was het beter weer! Ongeveer 30 graden Celsius (303 graden Kelvin). Het eerste bezoek was aan het Elena project, een antimaterie fabriek.

Elena - Antimatter Factory.

Elena – Antimatter Factory.

In deze fabriek is men aan het experimenteren met antimaterie. Antimaterie is hetzelfde als “gewone” materie, maar alle eigenschappen zijn het tegenovergestelde. Als antimaterie met gewone materie botst, dan heffen de deeltjes elkaar op en ontstaat er energie. Er hing een vrij aparte geur in het gebouw en onze (Nederlandse) gids moest een Dosimeter om. Met een Dosimeter worden schadelijke stoffen en straling gemeten. Het zag er erg indrukwekkend uit van binnen!

Elena van binnen.

Elena van binnen.

Nog meer van Elena.

Nog meer van Elena.

En als laatste, mijn favoriet, een bezoek aan het datacentrum van CERN! Hier worden Petabytes aan data in bewaard. Onze gids vertelde ons dat het lastig was om het complete datacenter uit te schakelen. De beste manier om het datacenter uit te schakelen, is om een bom te plaatsen bij de stroominputs. Maar dan heb je nog een probleem. De data wordt, nadat deze binnenkomt, gebackupt in Hongarije. Niet omdat Hongarije mooi is, maar omdat het ver genoeg van Zwitserland vandaan is om data te behouden als er bijvoorbeeld een aardbeving plaatsvindt. “Mochten wij er dan niet meer zijn, dan is de data in ieder geval nog bewaard” vertelde onze gids. In de ruimte waar we de rondleiding kregen stonden ook enkele bijzondere voorwerpen. Ook het computerscherm waar de eerste webpagina op is gemaakt. Het internet is namelijk “uitgevonden” in CERN. Ook het allereerste touchscreen is hier bedacht.

De ingang van het datacentre.

De ingang van het datacenter.

Een deel van het datacentre.

Een deel van het datacenter.

Het beeldscherm waarop de allereerste webpagina is gemaakt.

Het beeldscherm waarop de allereerste webpagina is gemaakt.

Wordt vervolgd

Het was kortom een erg indrukwekkende eerste week bij CERN. Volgende week verschijnt er weer een nieuw artikel in deze reeks! Voor deel 2, klik hier.