/forskning

Fysikere i verdens største dataopsamling: Seks gigabyte pr. sekund

Cern har testet det netværk, som skal indsamle og analysere data fra Large Hadron Collider. De kolossale datamængder skal behandles på 140 datacentre spundet sammen i et gigantisk grid.

Af Magnus Bredsdorff, torsdag 02. jul 2009 kl. 08:28

Alt er klar til, at fysikerne kan få det maksimale ud af deres anstrengelser, når Cern i løbet af efteråret begynder at smadre bundter af protoner sammen med tæt på lysets hastighed i Large Hadron Collider (LHC) i Geneve.

I de seneste par uger har forskere fra hele verden knoklet i døgndrift for at teste det system til at opsamle data fra partikelacceleratoren, som er afgørende for, om det lykkes at finde Higgs-bosonen og spore andre fysiske fænomener, som opstår af sammenstødene.

Datamængderne er enorme. Ifølge en pressemeddelelse fra Cern er systemet gearet til at modtage seks gigabyte per sekund under for eksempel ti timers uafbrudte eksperimenter.

Dataene bliver distribueret ud på et gigantisk grid-netværk, der dækker 140 datacentre i 33 lande. De fordeler den videre analyse imellem deres computere.

Ifølge Cern-pressemeddelelsen viser testen, at det ikke er noget problem at køre en million analyser per sekund.

Dansk forsker: Accelerator er som et løg med hul i
Ph.d Anders Wäänänen fra Niels Bohr Institutet, som har været med til at opbygge den nordiske del af Cern-netværket, sammenligner selve den 27 kilometer lange partikelaccelerator med et løg, der bliver boret hul igennem.

Protonerne bliver smasket sammen inde i hullet og danner dernæst nye partikler. De forsvinder ud i alle retninger i løget.

»Hver ring rummer sensorer, som reagerer med forskellige typer af partikler. De leverer elektriske impulser, som bliver lavet om til data, der fortæller, hvor der skete et sammenstød, og hvordan det skete,« forklarer han.

Algoritmer afslører partikler
En stor del af udvælgelsen af, hvilke data fra sensorerne som skal gemmes, sker i specialhardware i tilknytning til de enkelte lag, allerede inden de bliver sendt videre det store computergrid.

»Men på et tidspunkt bliver beslutningerne meget komplekse,« siger Anders Wäänänen.

Når det indtræffer, bliver data spredt rundt i verden for at udnytte den samlede computerkraft fra de 140 datacentre til analyserne.

Bombardementet af partikler mod LHC's sensorer sker nemlig efter bestemte mønstre alt efter, hvilken partikel der er tale om. Derfor bruger forskerne algoritmer til at genkende mønstre og dermed de partikler, der er til stede.

På den måde gør algoritmerne det muligt for fysikerne at finde ud af, hvad der skete i få brøkdele af et sekund, efter at protonerne stødte sammen.

Anders Wäänänen betegner det som 'et puslespil af gigantiske dimensioner' at lede efter for eksempel Higgs' partikel i de enorme datamængder. Netop derfor er der brug for at koble så mange computere sammen.

Cern har efter et uheld sidste år planer om at begynde LHC-eksperimenterne til oktober.



02. jul 2009 kl 10:51

avatar

Asbjørn Estrup Enemark

Internet

*Suk* hvis bare min internet forbindelse kunne trække 6 Gbps :-)


02. jul 2009 kl 11:41

Carsten Scherrebeck Møller

Antal 3D-pixels pr. nanometer?

De 6 gigabyte pr. sekund, hvor stor en billedopløsning svarer dette til, i tredimensioner?


02. jul 2009 kl 12:05

Jens Madsen

Re: Internet

6 gigabyte/sekund = 48 Gbps.

Det er muligt, at trække denne hastighed igennem et enkelt optisk fiber. Så måske vil det komme ud i husene en dag, når at elektronikken kan følge med.

Skal man med "lavbudget" håndtere sådanne datamængder, vil man normalt købe en stak harddiske, og distribuere dataene ud på dem. Med 6 gigabyte per sekund, og hvis data kommer som 32 bit (4 bytes per word), så vil datahastigheden være 1.5 gigabit per sekund. Denne bitrate kan de fleste SATA harddiske håndtere. I princippet, kræves ikke andet end 32 SATA harddiske, f.eks. på en terabyte hver. Eventuelt kan bruges et lidt større antal harddiske, så data gemmes med fejlkorrektion, og dermed sikre mod en smadret harddisk.

Med simpel hardware baseret på en stak harddiske, kan forskerholdet få en kasse hjem med data, og så er det deres eget problem at finde en computer til at behandle data. Så der behøver ikke nødvendigvis store computerresourcer hos Cern.

Hvis data gemmes på en harddisk, spares også de mange dyre high-speed internet forbindelser. Ingen data sorteres fra, så det er ikke muligt at noget er "spist" af deffekt kundespecificeret hardware.

Håndteringen af dataene "live" via dyre ínternetforbindelser, er nok lidt "blær". Men imponerende.


02. jul 2009 kl 13:21

Carsten Scherrebeck Møller

Re: Re: Internet

Håndteringen af dataene "live" via dyre ínternetforbindelser, er nok lidt "blær".

Sandsynligvis skyldes det behovet for straks at kunne distribuere en analyseevne til flest mulige forskere, så de kan gå på jagt efter guldet, at opdage hvad vakuum består af. Desuden er dataene så kostbare, at det ikke er klogt at vente med at distribuere dem. Distributionen bør desuden straks evne at lade mange computere begynde på en fælles analyse, en mulighed for at spare tid, som risikerer at være nødvendigt hvis amerikanerne skal bankes i denne konkurrence.

»En million analyser pr. sekund.« Hvad menes der med dette? Hvor omfattende er antallet af data er hver analyse, og hvor mange formler er der i hver analyse, og hvor mange beslutninger (if, else, case ...) og hvor mange løkker, og så videre? Er der i øvrigt en mængdemæssig standardiseret måleenhed for sådant?


02. jul 2009 kl 14:04

Jens Ramskov

15 millioner gigabyte om året skal gemmes

Vi regner med at skulle gemme cirka 15 millioner gigabyte af data om året fra LHC's detektorer.

Dette skrev Francois Grey fra CERN i Ingeniøren for et år siden (13. juni 2008).

http://ing.dk/artikel/88945-op...deer


03. jul 2009 kl 03:06

Johan-Albert Boye

Re: 15 millioner gigabyte om året skal gemmes

Undskyld; men var hele dette gigantiske data-netværk ikke klar første gang "dommedagsmaskinen" blev startet op?


Ny i debatten? Opret en brugerkonto

  • Seneste nyt
  • Mest læste
  • Topdebat
Populært på Facebook
 

Nyhedsbrev

Tilmeld dig vores nyhedsbrev.