Hvordan behandler man ti millioner gigabyte data i timen?
Det australske forskningsinstitut CSIRO vurderer, at forskere fra astronomer til biologer vil løbe panden mod datamuren, med mindre der bliver udviklet mere effektive metoder til at behandle enorme datamængder.
Mens de fleste af os har nogle hundrede gigabyte data derhjemme, skal fremtidens astronomer behandle op til 10 millioner gigabyte i timen. Astronomerne er blot et eksempel på videnskabsmænd, der i fremtiden vil blive overvældet af data.
Et andet eksempel er DNA-sekvenser, der vil producere hundredtusindvis af databaser, der hver har en størrelse på omkring 50 GB,
Til at holde styr på alle disse data kræves ny software, da eksisterende programmer, som måske er gode nok til mindre datamængder, ganske enkelt ikke er effektive nok, når datamængden stiger eksplosivt.
Tilmed er det ikke alle de nye data, der hele tiden er tilgængelige, hvilket der også skal tages hensyn til.
Derfor har australske CSIRO (Commonwealth Scientific and Industrial Research Organisation) startet et nyt forskningsprogram med titlen Terabyte Science.
»Store og komplekse datamængder forekommer næsten overalt i forskning og industri og vil forhindre uviklingen af australsk forskning, hvis der ikke gøres noget ved problemet,« siger dr. John Taylor i en pressemeddelelse fra CSIRO.
Formålet er ikke alene at udvikle ny software men også den bagvedliggende matematik, der stort set er et uudforsket område. Det er ifølge forskerne ikke tilstrækkeligt at udvikle hurtige supercomputere og storageenheder med masser af plads.
Ifølge John Taylor vil arbejdet komme til at involvere masser af it-ingeniører, matematikere og ingeniører. John Taylor har selv tilbragt ti år i USA, hvor han arbejde med lignende problemer.
Firmaer som Intel har forskningsprojekter, der undersøger, hvordan data kan genkendes og behandles direkte på harddiskene, således at de i mange tilfælde slet ikke skal indlæses i hovedcomputeren.






