Data-analyse er største udfordring
more_vert
close

Få de daglige nyheder fra Version2 og Ingeniøren. Læs mere om nyhedsbrevene her.

close
Ved at tilmelde dig accepterer du vores Brugerbetingelser, og du accepterer, at Teknologiens Mediehus og IDA-gruppen lejlighedsvis kan kontakte dig om arrangementer, analyser, nyheder, job og tilbud m.m. via telefon og e-mail. I nyhedsbreve, e-mails fra Teknologiens Mediehus kan der forefindes markedsføring fra samarbejdspartnere.

Data-analyse er største udfordring

Det er Højteknologifondens største bevilling nogensinde på 86 mio. kr., der netop er blevet givet til opbygningen af en teknologiplatform, der på sigt skal gøre det muligt at kortlægge den danske befolknings DNA og finde forbindelser mellem gener samt sygdomme, effektiv behandling osv.

Der skal bl.a. opbygges en afdeling med gensekventeringsmaskiner, men ikke mindst skal der opbygges en bioinformatikinfrastruktur, der kan håndtere de mange data.

»I takt med at prisen falder på gensekventeringer, flytter omkostningerne over på bioinformatikken, der skal behandle de enorme mængder data og analysere, hvordan genvariationer spiller sammen med sygdomme osv.,« siger Søren Brunak, der er professor og leder af Center for Biologisk Sekvensanalyse på DTU, der er blandt verdens førende på feltet og skal arbejde med den del af projektet.

»Vi skal udvikle metoder, der kan analysere mange hele genomer på en gang og omsætte det til viden, der kan bruges til udvikling af lægemidler, forebyggelse, diagnostik, kostråd osv. Vi skal bygge videre på det, vi har opbygget på DTU gennem årene.«

Og der skal bruges en masse rå computerkraft for at finde ud af, hvilke effekter de mange forskellige genvariationer giver. Det kan f.eks. være at finde betydningen af, at et bestemt protein mangler en bestemt aminosyre. Nogle gange er det lige meget, andre gange kan det føre til en neurogenerativ sygdom.

»Også bare det at opbevare og organisere de mange terabyte af data, så det kan linkes til den enkelte og ses af lægerne, er en kæmpe opgave. Og biologien har ikke været vant til at arbejde med data i denne størrelsesorden. Det er noget, man kender fra fysikerne og astronomerne.«

Søren Brunak forventer, at platformen vil være ret godt kørende inden for et år, men påpeger, at det frustrerende inden for området er, at man aldrig vil blive færdig, fordi datamængderne bare vil stige og stige.

Virusjagt og familiekortlægning

Platformen skal i første omgang bruges til to projekter. I det ene skal der gensekventeres 50 familier bestående af mor, far og barn, så forskerne kan få større viden om, hvordan to genomer bliver til ét.

»Sekventeringen af de 150 vil være meget nøjagtig, så vi får et enestående atlas over den danske arvemasse, som vil være et godt grundlag for at gå videre, da vi vil få et bud på, hvad der er mere almindelige og sjældne variationer, så vi ved, hvad vi skal kigge efter,« siger Søren Brunak.

Det andet projekt er en kæmpe fisketur efter vira, der forårsager cancer, for at udvikle vacciner mod dem.

»Det er et højrisikoprojekt, for det kan være, at man ikke kan finde en ny virus eller at man efterfølgende ikke kan lave en vaccine, men lykkes det, giver det masser af kommercielle muligheder.«

Den femårige bevilling er givet i fællesskab til Københavns Universitet, DTU, Aarhus Universitet, Aalborg Universitet samt virksomhederne Bavarian Nordic, Genomic Expression og Beijing Genomics Institute Europe. Parterne medfinansierer med 84 mio. kr., så det samlede budget er 170 mio. kr. De 60 mio. kr. kommer fra Beijing Genomics Institute, der er verdens største gensekventeringscenter, der har europæisk hovedkvarter i København.

sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Jeg vil gerne personligt kunne kontrollere hvem der får adgnag til denne information. f.eks om den må deles internationalt, kommercielt osv. Det må en online service sagtens kunne ordne.

For det andet er strukturen vel nem nok. Det er vel bare at bygge et stort nok Hadoop cluster :)

  • 0
  • 0
Bidrag med din viden – log ind og deltag i debatten