/elektronik

Supercomputer er 99 procent mere effektiv end forgængeren

Amerikanske forskere har bygget verdens hurtigste rekonfigurerbare supercomputer, der ved hjælp af FPGA'er vil være op mod 99 procent mere effektiv end en almindelig supercomputer.

Af Mads Ølholm, tirsdag 28. jul 2009 kl. 07:27

I sidste uge afslørede University of Florida, at verdens hurtigste rekonfigurerbare supercomputer er blevet installeret på universitetet.

En rekonfigurerbar computer er opbygget omkring en række FPGA'er (Field Programmable Gate Arryas), der gør det muligt at forsyne computeren med et vilkårligt instruktionssæt, der passer bedst til den opgave, som computeren skal udgøre.

I det aktuelle tilfælde har de tre universiteter valgt at anvende 96 Altera Stratix-III E260 FPGA'er, der hver indeholder 254.000 logikelementer samt 204.000 registre. Dette har universiteterne kombineret med 4,25 GB ram til supercomputeren, der har fået navnet Novo-G. FPGA'erne står dog ikke alene, da de understøttes af 26 quad-core Nehalem Xeon-processorer med i alt 576 GB ram.

Endnu på begynderstadiet
Rekonfigurerbare supercomputere er endnu på begynderstadiet, men forskerne håber, at de vil vise sig at være op mod 99 procent mere effektive end almindelige supercomputere, da instruktionssættet kan tilpasses den aktuelle opgave, hvilket giver en kraftig øget effektivitet.

At computerne endnu er på begynderstadiet, kan også ses af det faktum, at en enkelt FPGA, der populæt sagt svarer til en processor, indeholder 254.000 logikelementer, hvor en moderne processor fra Intel kan indeholde op til en mia. transistorer, hvoraf en betydelig del dog anvendes til cache.

De tre universiteter, der er gået sammen i forskningscentret ved navnet NSF Center for High-Performance Reconfigurable Computing, er Viginia Tech, University of Florida samt Brigham Young University. Universiteterne oplyser intet om Movo-G's ydeevne, men det afhænger også helt af det aktuelle instruktionssæt.

Desuden medvirker en lang række computerfirmaer, der blandt andre omfatter Intel, der har sin egen rekonfigurerbare computer, der rent fysisk befinder sig i firmaets forskningsfacilitet Terascale Lab i Santa Clara i Californien. Intel anvender dog ikke denne computer til at forske i nye instruktionssæt, men til at undersøge, hvordan man bedst forbinder forskellige processorkerner med hinanden.



28. jul 2009 kl 08:29

avatar

Karl Kaas Laursen

Pærer og bananer....

...indeholder 254.000 logikelementer, hvor en moderne processor fra Intel kan indeholde op til en mia. transistorer, hvoraf en betydelig del dog anvendes til cache.

I skoletiden lærte jeg, at en sammenligning mellem "pærer og bananer" ikke kan bruges i nogen logisk slutning. Lidt i stil med artiklen her, hvor 254.000 "pærer" sammenlignes med 1 mia "bananer", hvoraf en stor del ikke er til at spise.

Hvis man ikke er inde i FPGA-teknologi, kunne man foranledes til at tro, at 1 transistor = 1 logikenhed, hvilket nok ikke er fair. Jeg vil gætte på, at man kan få en Stratix-III til at knuse en pæn slat beregninger, hvis man designer en skræddersyet løsning in VHDL (FPGA-sprog) til hvert problem.


28. jul 2009 kl 09:43

Leif Neland

99%?

Betyder det "næsten dobbelt?"
100% hurtigere må jo være dobbelt?

Eller sparer man 99% tid, så det kun tager 1% = 100 gange hurtigere?

Eller hva' ?


28. jul 2009 kl 09:53

avatar

Lars Lundin

100% mere effektiv == dobbelt så effektiv

"99% mere effektiv" må på almindenligt dansk betyde lige knapt en fordobling af effektiviteten, men gad vide om det er det, der menes.


28. jul 2009 kl 10:06

avatar

Michael Schade

Re: 99%?

Tror det går på udviklingstid.

Du kan lave en special purpose processor i fpga på 1% af den tid som du normalt ville bruge på at lave samme som en chip i sig selv.
Ulempen er så det ekstra delay og gateforbrug du har på hvert logik element i fpga, men finder du et godt design så kan du jo altid lave en million af dem i silicium bagefter.


28. jul 2009 kl 10:11

avatar

Lars Lundin

Re: Re: 99%?

"Tror det går på udviklingstid."

Og jeg tror regning med procenter er svært.

Det havde været rart hvis man ikke skulle gætte sig frem til artiklens pointe.


28. jul 2009 kl 10:25

Jens Dalsgaard Nielsen

press

morn :-)

20 sek i google ->
http://www.dsp-fpga.com/news/T...8203
og 25 sek mere ...
http://news.ufl.edu/2009/07/23...ter/

så hvis man nærlæser den lidt er det ikke rigtig supercomputers de bider skeer med, men snarere den største fpga cluster. Det ser ud til at de har 4 stk alteras i en eller anden form for PC og at de har 24 af disse PCere i et cluster.

men også at det er ret sparsomt hvad de egentlig vil bruge den til...

og billedet i artiklen har vist ingenting med den omtalte computer :-)


28. jul 2009 kl 11:03

Frithiof Andreas Jensen

Mon det er besværet værd?

Jeg har i min tid set mindst 3 FPGA-baserede løsninger blive overhalet af generiske CPU'ere med software.

Der sker gerne det at een eller anden 'beviser' at en FPGA baseret løsning er mange gange hurtigere og billigere end den CPU-baserede man bruger nu.

Derefter går der op til et år med at lave en prototype baseret på bleeding-edge chips og bleeding-edge tools; med masser & masser af bugs men det kommer som regel til at virke godt nok til at man fortsætter.

De næste eet eller to år går på at udvikle en programmeringsmodel der passer til eens FPGA så man kan oversætte sin værdifulde eksisterende IP til det nye miljø. Det er gerne der at projektet begynder at miste folk.

Sømmet i kistelåget kommer omsider når man finder ud af at den standard CPU man nu kan købe, 3 år senere, har samme performance som eens FPGA løsning OG man kan smide lidt extra fnadder som user-interface e.t.c oveni også.

Efter min mening: Hvis man ikke kan nå at lave sit FPGA projekt færdigt på 6-9 måneder skal man hellere lade helt være og bruge en CPU/DSP i stedet for.


29. jul 2009 kl 19:17

Jens Henrik Sandell

Gule pærer og grønne pærer

Hvis en FPGA løsning skal sammenlignes med noget, kan det vel kun være Vektor computere.

Det er vel essensen af hvad en FPGA bør kunne emulere: En optimeret pipeline med et til opgaven tilpasset sæt microcode. Og så sætter man det hele på et PCI-E board og dumper det ned i et antal bambus-PCer. Og viola, så har man et cluster.

Det er sgu da at gå gennem butikken og helt ud i bageriet for at hente sit brød. Men OK der er selvfølgelig nogle computing intensive applikationer som kan profittere på denne implementering.

http://en.wikipedia.org/wiki/V...ssor


Ny i debatten? Opret en brugerkonto

  • Seneste nyt
  • Mest læste
  • Topdebat
Populært på Facebook
 

Nyhedsbrev

Tilmeld dig vores nyhedsbrev.