Status

  • Ing.dk er under ombygning - vi er tilbage mandag med nyt udseende. Henover weekenden er alt vores indhold åbent, men man kan ikke logge ind og debattere.

AI-værktøj begejstrer dansk forsker: Forudsiger proteiners finurlige 3D-struktur på sekunder

PLUS.
Illustration: Bigstock/sergunt

Skal man forstå en sygdoms mekanismer i detaljer, skal man vide, hvordan vores proteiner ser ud og opfører sig i kroppen.

Det er et overblik og indblik, som forskerne har haft særdeles svært ved at få, da proteinerne hverken kan ses med det blotte øje eller gennem et almindeligt mikroskop.

Derfor er kun få ca. en tiendedel af kroppens i alt ca. 20.000 proteiner kortlagt på en måde, så man kender deres præcise tredimensionelle opbygning, og det arbejde har det taget årtier at udføre ved hjælp af bl.a. røntgenkrystallografi, hvor man kortlægger strukturen ud fra strålernes afbøjninger gennem en krystal.

Men nu ser det ud til, at kunstig intelligens fra Google-virksomheden DeepMind kan tilbyde det hjælpende øje, som gør molekylærbiologerne i stand til at stille skarpt på de strukturer, som kan hjælpe forskerne med at forstå sygdomme som f.eks. kræft eller parkinson’s sygdom.

Med AI-algoritmen AlphaFold hævder de nemlig at kunne give kvalificerede bud på 98,5 procent af vores proteiners rumlige opbygning alene ved at kende aminosyresekvenserne, og at 58 procent af disse forudsigelser er af høj kvalitet, hvilket vil sige, at nøjagtigheden af forudsigelsen er meget høj. Algoritmen er trænet på 170.000 proteinstrukturer, som tidligere er bestemt eksperimentelt.

»Det her værktøj er ret elegant og kommer til at spare os for en hel masse arbejde,« siger Kresten Lindorff-Larsen, som er professor på Linderstrøm-Lang Centret for Protein Videnskab på Københavns Universitet.

Læs også: Kunstig intelligens knækker proteinfoldningsproblemet

Han leder en forskningsgruppe, som har sat sig en enorm forskningsopgave for med hjælp fra Novo Nordisk Fonden: De vil helt generelt prøve at forstå, hvordan ændringer i aminosyresekvenserne i vores proteiner kan gøre, at vi bliver syge.

Det forventer gruppen at kunne give en række svar på ved at se på, hvad mutationer i vores arvemasse kan gøre ved proteinernes måde at folde sig på.

For hvis en mutation gør, at et protein ikke bliver produceret korrekt, og derfor folder forkert på grund af ændrede aminosyrer, kan det betyde, at de i stedet klumper sig sammen eller mister evnen til at arbejde sammen med andre proteiner med sygdom til følge.

Ballet er åbnet

Forskningsgruppen har de seneste år især arbejdet med arvelige former for tyktarmskræft, stofskiftesygdomme og en række neurologiske sygdomme, hvor man i høj grad har kendt strukturen af de proteiner, der har set ud til at spille en større rolle i sygdomsudviklingen.

Læs også: Kunstig intelligens knækker proteinfoldningsproblemet

Gennem disse år har gruppen nærstuderet ca. 50 proteiner, og tiden var moden til at skalere projektet op for til sidst helst at få inkluderet alle humane proteiner og de mange millioner af aminosyreændringer, der kan opstå, hvis genetikken driller.

Og nu er det komplicerede bal åbnet på en helt anden måde, understreger Kresten Lindorff-Larsen.

»Vi har tidligere måttet vælge projekter ud fra det kriterium, at proteinstrukturerne var kendte i forvejen, for ellers var der spørgsmål, vi ikke ville kunne besvare. Nu har vi en kæmpe ressource til at foretage den ønskede opskalering,« siger han og fortsætter:

»Jeg skal faktisk have et møde med en del af min forskningsgruppe i dag, så vi kan snakke om, hvad det er, vi nu har fået mellem hænderne, så vi virkelig bare kan køre på,« siger Kresten Lindorff-Larsen.

Dog, understreger han, skal man være varsom med at konkludere, at man nu har det fulde billede af stort set alle proteinerne i vores krop for der er som sagt kun tale om forudsigelser og ikke om konkrete afbildninger af strukturerne.

Læs også: Nanojulekalender 14: AI folder proteiner, men hvor godt?

DeepMind har i den frit tilgængelige software selv noteret, hvor præcise forudsigelserne ser ud til at være for det enkelte protein, og ifølge Kresten Lindorff-Larsen er det måske lige godt halvdelen af forudsigelserne, der viser en veldefineret struktur.

Og selv, hvis man bliver skarpere på forudsigelserne, forventer han ikke, at algoritmen i sin nuværende form vil kunne få mere end 70 procent af strukturerne til at sidde tilstrækkeligt i skabet.

Mange komplicerede proteiner

Udfordringen med nogle proteiner er nemlig, at de sidste 30 procent er såkaldte intrinsisk uordnede proteiner, som ikke har en veldefineret struktur, men kan indtage mange forskellige. Disse er det noget sværere at holde styr på.

»Så det er ikke noget nemt problem, de har løst, når de alligevel har bud på næsten alle proteiner i kroppen,« siger Kresten Lindorff-Larsen.

Resten kan dog sagtens stadigvæk give et godt praj om, hvordan strukturen kan tænkes at se ud, så man kan starte sin forskning længere fremme end normalt, fordi man har et bud at starte ud fra, understreger professoren.

Læs også: AlphaGo beviser: Kunstig intelligens bliver bedre uden ekspertviden fra mennesker

Ifølge grundlægger af DeepMind Demis Hassabis er AlphaFold sammensat af 32 separate algoritmer, som på minutter – og nogle gange sekunder – kan forudsige en proteinstruktur, blot med hjælp fra et almindeligt grafikkort.

»Det tager et kort få minutter at folde et protein, hvilket ville have taget års eksperimentelt arbejde,« siger han til New Scientist.

Ifølge Kresten Lindorff-Larsen skal man dog ikke frygte at blive arbejdsløs, hvis man hidtil netop har arbejdet eksperimentelt på at redegøre for proteiners struktur, for der er som sagt stadigvæk usikkerheder i mange af forudsigelser, som skal dobbelttjekkes på anden vis, når man arbejder med proteinerne. Og han forventer ikke, at første prioritet for DeepMind bliver at prøve at højne denne sikkerhed til 100 procent.

»»Den nye beregningsmetode vil være en hjælp og ikke en konkurrent til eksperimentelle studier. Den vil hjælpe forskere med at designe deres eksperimenter og fortolke deres data. Mange af de store ubesvarede biologiske spørgsmål omhandler, hvordan forskellige proteiner arbejder sammen, og hvordan deres dynamik og uorden påvirker proteinernes funktion. Det er her de næste landvindinger vil blive gjort,« vurderer Kresten Lindorff-Larsen.

DeepMind har ifølge New Scientist offentliggjort flere end 350.000 strukturforudigelser i alt, inklusive proteinerne i 20 organismer, som er vigtige i forskning såsom E. coli og gær.

Inden for få måneder satser forskerne på, at de har fået alle de proteiner med, som videnskaben kender – hvilket er op mod 100 millioner.