Kunstig intelligens knækker proteinfoldningsproblemet

Proteiners funktion er bestemt af deres form, men formen har hidtil været næsten umulig at bestemme teoretisk. Illustration: arkiv

Proteiner er komplekse, foldede molekyler opbygget af kæder af aminosyrer, som er styrende for livets processer. Et proteins virkemåde er på altafgørende vis bestemt af dets form. Men at forstå, hvordan proteiner folder sig sammen, har længe været en uløst gåde.

Nu har Google-firmaet DeepMind, der er mest kendt for sine programmer, der spiller skak og andre brætspil, bedre end nogen mennesker og andre maskiner, lanceret AlphaFold, der ud fra kunstig intelligens kan forudsige, hvor proteinerne folder sig sammen og derved får deres unikke egenskaber.

Læs også: BAGGRUND: AlphaZero spiller skak på en overnaturlig måde

DeepMind lod AlphaFold deltage i konkurrencen Critical Assessment of protein Structure Prediction (CASP). Her skal et program forudsige formen af protein, og ved at sammenligne med en eksperimentel bestemmelse af proteinets form, f.eks. med røntgenkrystallografi, kan man derefter bestemme en score for, hvor god for forudsigelsen er.

Da AlphaFold i 2018 deltog i CASP, scorede den lige under 60 point ud af 100. Men i den seneste konkurrence CASP14 i 2020 blev en forbedret version af AlphaFold en klar vinder med en score på 92,4 point.

Pointene tildeles, efter hvor godt programmet kan forudsige placeringen af hvert enkelt atom i proteinet. Med en score på 92,4 svarer det til, at den gennemsnitlige fejl på placering af et atom er 0,16 nanometer.

Generelt er en score på over 90 lige så god som den eksperimentelle bestemmelse, det er muligt at opnå. Det er første gang, et program har opnået denne høje score.

Her ses AlphaFolds beregninger af foldede proteiner sammen med de eksperimentelt bestemte strukturer Illustration: DeepMind

50 år gammelt problem

Proteinfoldningsproblemet går tilbage til 1972, hvor dette års Nobelprismodtager i kemi, den amerikanske biokemiker Christian Arfinsen postulerede, at i teorien ville sekvensen for aminosyrer fuldstændigt bestemme, hvordan proteinet foldede sig sammen.

Problemet var blot, at der kan tænkes omkring 10^300 forskellige foldninger for et protein, og at finde den rigtige foldning ville være helt umuligt med sædvanlige regnemetoder. Alligevel klarer proteinerne det selv på kort tid, ofte inden for millisekunder. Det kaldes for Levinthals paradoks efter den amerikanske molekylærbiolog Cyrus Levinthal.

DeepMind har endnu ikke oplyst i detaljer, hvordan AlphaFold virker. Men programmet er blevet trænet på 170.000 proteinstrukturer.

Selv om DeepMind er meget tilfreds med deres bedrift, er der stadig plads til forbedringer. Det er ikke alle de forudsagte proteinstrukturer, der er perfekte, men alt i alt mener firmaet, at de med AlphaFold vist, at det med kunstig intelligens er muligt at knække problemer, som ellers ville være uløselige.

Mohammed AlQuraishi fra Columbia University i New York siger til Nature, at der er tale om et stort gennembrud, som baner vejen for fremstilling af nye lægemidler og design af proteiner med særlige funktioner.

»Det er et af de meste betydningsfulde i min levetid,« siger han.