USA's nye supercomputer får 200.000 harddiske

Den militære forskningsenhed i USA, Darpa, er ved at færdiggøre specifikationerne til en ny supercomputer, som skal stå klar i 2009.

Computeren får hele 200.000 harddiske, og det kræver et nyt filsystem. Det vil IBM gerne være med til at udvikle, selv om firmaet har solgt sin harddiskforretning.

IBM's filsystem hedder GPFS, hvilket er en forkortelse for General Parallel File System. Systemet skal danne grundlaget for de massive storageenheder, der skal gemme alle supercomputerens data.

Ifølge Roger Haskin, der er chef for udviklingen af systemet, er det en gigantisk udfordring at styre 200.000 harddiske.

»For at få det hele til bare nogenlunde at hænge samen, skal der anvendes I/O-controllere for over 100 millioner kroner. Disse skal programmeres til at fungere som avancerede RAID-controllere.«, siger Roger Haskin.

For at få hurtig nok adgang til filernes metadata, vil disse blive gemt i flash, hvilket er en investering på yderligere godt 100 millioner kroner.

Dertil kommer selve diskene, der skal monteres i 19" kabinetter, men ikke på den traditionelle facon.

»Traditionel montering tillader kun én harddisk i dybden. Vi arbejder på at udvikle blade (bakker til hylderne i serverskabene, red.), hvor der er plads til tre eller fire diskdrev i dybden, således at vi kan bruge pladsen mere effektivt«, siger Roger Haskin.

Bladene giver til gengæld udfordringer, da det er nødvendigt at tage alle bladets harddiske ud af drift, når blot en enkelt skal skiftes. Derfor vil andre harddiske blive anvendt som buffere, der midlertidigt gemmer data, indtil de harddiskene igen kører.

Den udskiftede harddisk vil blive genopbygget ved hjælp af RAID-teknologi, men IBM vil anvende en variation af RAID 5 med 8+3 bit fejlkorrigering, som bliver spredt ud over 40-50 harddiske. Det skal sikre mod, at individuelle diske bliver for hårdt belastet, når en ny harddisk skal genopbygges.

Emner : Datalagring