Selvreparerende computer fra DTU skal bruges i rummet
more_vert
close
close

Vores nyhedsbreve

close
Når du tilmelder dig nyhedsbrevet, accepterer du både vores brugerbetingelser og at Mediehuset Ingeniøren og IDA group ind i mellem kontakter dig angående events, analyser, nyheder, tilbud etc. via telefon, SMS og e-mail. I nyhedsbreve og mails fra Mediehuset Ingeniøren kan findes markedsføring fra samarbejdspartnere.

Selvreparerende computer fra DTU skal bruges i rummet

Den amerikanske rumfartsorganisation Nasa er blevet interesseret i et meget eksotisk dansk computerdesign. Der er tale om en computer, der kan reparere sig selv - omtrent på samme måde, som når et menneske reparerer sig selv med sårheling og knoglebrud, der vokser sammen igen.

Derfor har den fået navnet eDNA, fordi ideen om uprogrammerede stamceller er en god metafor for mekanismen.

Sådan en computer kan blive ekstremt robust, næsten usårlig. Og det kan Nasa bruge til noget. Rummet er nemlig et farligt sted for elektronik, som ofte tager skade af solvinde og kosmisk stråling. Og da det er sjældent, man kan sende en servicetekniker af sted for at reparere elektronik i rummet, så går satellitter og andet kostbart udstyr ofte tabt, når den første alvorlige fejl indtræffer.

Nasas interesse har medført, at en ph.d.-studerende fra DTU Informatik, Michael Reibel Boesen, i øjeblikket befinder sig i Californien hos Nasas Jet Propulsion Laboratory. Her skal han prøve at bygge den danske computer ind i et spektrometer, som er magen til et, der skal i kredsløb om Mars og lede efter livstegn på planeten. Det sker ved at måle på gasser i den tynde atmosfære.

Hans ambition er imidlertid at opnå, at Nasa også vælger at implementere det robuste computerdesign i satellittens navigationssystem.

Det næste skridt efter redundans

»Det hele begyndte med, at vi overvejede, hvordan man kunne lave en virkelig pålidelig computer,« fortæller professor Jan Madsen fra DTU Informatik.

Den typiske metode er at bruge redundans, det vil sige et system, som på en eller anden måde er dubleret, sådan at reserveelementer kan tage over, hvis en komponent går i stykker. Det er derfor, fly har dobbelte tændingssystemer og somme tider flere motorer. Og det er derfor, bankerne bruger spejlede servere til kundernes data.

Men redundans er et gammelt og velkendt princip. Det måtte være muligt at udvikle nye principper, der gav et "giant leap", et kæmpespring fremad.

Resultatet er en konstruktion, som har et større antal ufærdige computer-enheder på samme chip. Altså nogle helt ens processor-celler med egne hukommelsesområder. Nogle af de små computere skal specialiseres til forskellige opgaver, der skal løses, mens resten skal ligge passivt i reserve uden specialisering.

I det øjeblik en af de fungerende computer-celler fejler - af en eller anden grund - overføres dens specialisering og arbejdsopgaver til en reservecelle, og den oprindelige celle drosles ned og slukkes. I princippet som en menneskelig stamcelle, der specialiseres og tages i brug første gang.

I praksis sker det ved, at hver af de fungerende computerceller også udfører en sekundær skyggeproces i baggrunden, som er en kopi af en anden celles primære opgave. Hvis de to parallelle processer pludselig får forskellige resultater, er der noget galt. Og en særlig algoritme bestemmer så, om en af dem skal tages ud af drift og erstattes med en af reserverne.

Målet er en ASIC

»I vores forsøgsmodeller har vi til hver celle brugt en aritmetisk enhed med lokal hukommelse til at udføre selve beregningen og en lille processor (picoBlaze) til at udføre konfigurering og reparation af cellen. Den lokale hukommelse skal blandt andet rumme opskriften på dens særlige funktionsegenskaber. I første omgang er processorenheden implementeret i 81 eksemplarer i en rekonfigurerbar FPGA, men meningen er, at der til sidst skal fremstilles en ASIC, altså en færdig chip med de samme egenskaber, men med flere celler,« siger han.

Mellem de forskellige celler, både fungerende og reserver, er et mesh-netværk lagt ned i samme chip. Det er altså et privat netværk mellem cellerne, hvori der løber informationer via en særligt udviklet dataprotokol. At det hedder et mesh-netværk skyldes, at alle celler ikke er direkte forbundet med hinanden. Det ville blive uoverskueligt. I stedet bruger de hinanden som relæstationer for den interne post.

Så alle celler undersøger alle meddelelser, der kommer forbi. Hvis beskeden ikke er til dem selv, sender de den videre i den rigtige retning, ligesom en router i et almindeligt computernetværk. På den måde hopper beskeden videre fra celle til celle, indtil den havner hos den rette modtager. Sådan fungerer internettet også, og det gør et trådløst Zigbee-netværk også, men eDNA-computeren bruger dog en meget simplere dataprotokol til det lille netværk på chippen.

»Cellerne kender ikke hinandens fysiske position. De sender beskeder til en bestemt celle-identitet. Hvis en celle bliver dårlig og skiftes ud med en anden, følger identiteten med,« siger han.

På den måde kan computeren bliver ved med at reparere sig selv, indtil der ikke er flere reserveceller tilbage. Hvor mange celler, der skal være i den endelige chip, er for tidligt at sige. Men en af de kommende opgaver bliver at optimere algoritmerne, så de bliver effektive uden at bruge for mange ressourcer på fejlmeddelelser, ændrede rutetabeller og vækningsmeddelelser til reserverne i det lille lokalnetværk på chippen.

Ph.d.-projektet er delvist finansieret af højteknologifonden Danes.

Dokumentation

Artikel i DTU Avisen

Kommentarer (21)

Ikke for at være negativ, men sev-REPARERENDE??
Det er er "blot" redundans i mere ekstrem form.........

  • 0
  • 0

Ikke for at være negativ, men sev-REPARERENDE??
Det er er "blot" redundans i mere ekstrem form.........

Al reparation er redundans i en eller anden form. Det kommer an på ens perspektiv.
Hvis du slår dig, så er det også bare redundante celler der udskifter de ødelagte når det heler. Eller hvis cellerne heler er det redundante molekyler der udskifter de manglende.
Men udefra ligner det reparation.

Men denne teknik bringer da redundansen et helt niveau længere ned, hvis ikke mere. Og fra de nuværende redundante systemers perspektiv ligner det skam selv-reparation.

  • 0
  • 0