Dette indlæg er alene udtryk for skribentens egen holdning.

Nanojulekalender 14: AI folder proteiner, men hvor godt?

14. december 2020 kl. 18:564
Artiklen er ældre end 30 dage

Proteinfoldning er en af de helt store "Grand Prize" i biomolekylær forskning, som der er kolossale forventninger til. Kan man forudse hvordan en bestemt sekvens af aminosyrer folder sig til et protein, er der ingen grænser for hvilke sygdomme man kan kurere og hvilke tigerspring forskningen så får mulighed for at tage. Senest har kunstig intelligens firmaet DeepMind taget fat på opgaven, og har vist at deres deep-learning algoritme AlphaMind kan forudsige en lang række proteinstrukturer med atomar præcision, i en kvalitet der kan sammenlignes med de bedste krystallografiske analyser. Hvis man er til den slags, har forfatterne publiceret en opsigtsvækkende artikel i tidsskriftet Nature sidste år, som såvidt jeg kan se er Open Access (gratis for alle).

Illustration: https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery.

For eksempel skyldes Alzheimers sygdom forkert foldede proteiner, og mange forskere mener at hvis man kan forudsige hvordan proteiner folder sig, kan man også få skovlen under denne rædselsfulde sygdom. Hvis man ved nøjagtigt hvordan proteinet folder sig, er det nemmere at finde eller syntetisere de molekyler der netop, præcis og kun blokerer det skadelige protein fra at lave ballade.

Remote video URL

Artiklen fortsætter efter annoncen

Det er måske (desværre) ikke så nemt. For det første er der noget der tyder på at man ikke - endnu - kan stole nok på AI-algoritmernes forudsigelser, og alligevel er nødt til at kontrollere med røntgendiffraktion eller kryo-elektronmikroskopi (som er en virkelig sej teknik!). Andre stiller spørgsmålstegn ved om forudsigelse af proteinstruktur er nok. For at kunne lave en effektiv medicin må man også kende reglerne og mekanismerne for foldningen, idet disse bestemmer hvordan et protein kan finde tilbage til sin naturlige form. Denne information er kodet ind i sekvensen af peptider, men bliver ikke fanget af AI-algoritmerne, der bare gætter hvordan proteinet ser ud, ikke hvad der afgør at det ser sådan ud. Her bliver det en lille smule svært for mig at følge med, men jeg prøver at hænge på:

Der er nemlig også andre endnu, der i det hele taget betvivler at proteinfoldningen er den hellige gral. Sagt på en anden måde: proteinfoldningen er en del af historien, ikke hele historien, bag proteinets virkemåde og effekt. Struktur er ikke funktion: proteiner med næsten ens struktur kan have meget forskellige egenskaber. I artiklen "Behind the screens of AlphaFold" peges der på flere andre problemer. Der er ingen tvivl om at proteinfoldning er en vigtig del af at kunne dirke låsen op til nogle af fremtidens medicinske gennembrud, men som med så meget andet, har komplekse problemer sjældent simple løsninger. AI-algoritmer som AlphaMind er fantastiske redskaber i forskernes arsenal, men erstatter ikke resten af værktøjskassen.

Jeg er selv - som så mange andre - dybt fascineret af AI-teknologi, og ser det som en af de mest spændende udviklinger på tværs af humanistisk, socialvidenskabelig og ikke mindst teknisk/videnskabelig forskning. Som forhenværende datalog er der da en del af mig der brænder efter at kaste mig over kunstig intelligens, og jeg er ikke så lidt misundelig på min dygtige datter (der studerer datalogi med fokus på machine og deep learning på Københavns Universitet #stoltfar). Jeg ser også en tendens overalt (både blandt forskere, journalister og almindeligt godtfok) til måske lidt for opskruede forventninger i forhold til AI-teknologiens omnipotente evne til at forudsige, generere og forklare alt mellem himmel og jord - ja der er nærmest ingen grænser for den nye guddoms kraft og potentiale.

Det mener jeg så at der er. Skakspil er ikke intelligens, selvom intelligente mennesker ofte er gode til at spille skak. AI-proteinfoldning erstatter ikke medicinsk forskning, selvom medicinsk forskning kan have stor nytte af AI-proteinfoldning. Disse sammenligninger er banale, men jeg er tilhører altså ikke singularitets-folket, der tror at computeren og kunstig intelligens i en kaskade af selv-optimeringer med et snuptag lige pludselig overhaler os allesammen i intelligens. Hukommelse, ja. Mønstergenkendelse, med tiden ja. Intelligens, næppe. Ingen tvivl om at AI bliver en kæmpe faktor i fremtidens samfund, men de bliver ikke smartere end mennesker. Det er stadig os pels-løse abekatte vi skal holde øje med. Tilbage på sporet:

Hvis der er nogen af jer der enten ved noget om proteinfoldning eller om AI .... eller måske endda begge dele(!), må I meget gerne belære mig og alle de andre amatør-klogeåger på ing.dk i kommentarfeltet nedenfor.

4 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
4
15. december 2020 kl. 13:21

Det er ikke bare spørgsmålet om den kan ramme præcist, men hvad den rammer. Har svaret relevans for spørgsmålet/problemet. Der er flere lag i det: algoritmen er ikke sikker nok til at kunne forudsige strukturen. Og hvis den endelig kan, har vi så lært hvordan proteinet opfører sig? ... måske er problemet at vi som mennesker elsker når noget kan måles... også selvom målingen er unøjagtig eller utilstrækkelig, eller måske ligefrem irrelevant.

3
15. december 2020 kl. 11:27

Kunstig intelligens, specielt deep learning, kan ramme ret præcist, men den kan også ramme meget langt ved siden af. Så validiteten af svaret skal altid kontrolleres. Hvis ikke man kan lave en sådan kontrol, skal svarene behandles med stor speksis.

2
15. december 2020 kl. 11:09

Jeg har ikke nærlæst artiklen, men som jeg forstod det, har de bygget en arkitektur hvor algoritmen træner sig op til at blive klog på hvordan aminosekvenserne opfører sig i praksis, hvor traditionelle algoritmer prøver ud fra på forhånd opstillede regler, som tilsyneladende ikke fungerer skidegodt i praksis (før Deepmind fik de svjh under 50% rigtige).

Det var det samme da Deepmind løste Go. På sin vis er det intuitionens sejr over formelle regelsystemer. At computerens intution vinder over den menneskelige intuition, skyldes ikke at den er bedre (den er langt mindre effektiv) men computeren kan afsøge langt flere muligheder og se langt flere eksempler, og ender derfor med at vinde.

Andre stiller spørgsmålstegn ved om forudsigelse af proteinstruktur er nok. For at kunne lave en effektiv medicin må man også kende reglerne og mekanismerne for foldningen, idet disse bestemmer hvordan et protein kan finde tilbage til sin naturlige form. Denne information er kodet ind i sekvensen af peptider, men bliver ikke fanget af AI-algoritmerne, der bare gætter hvordan proteinet ser ud, ikke hvad der afgør at det ser sådan ud.

Som jeg forstår små biologiske systemer, er de præget af en kolossal masse sammenstød der ligesom "tæver" tingene på plads undervejs i processen? Så den korrekte måde at deducere på, må vel være at køre en masse simuleringer og se hvad der med høj sandsynlighed sker?

Men simuleringer tager for lang tid at køre, og så er vi ovre i heuristikker, hvor et netværk der studerer problemet tilsyneladende når frem til langt bedre heuristikker end en hel bunke forskeres håndkodede regler.

Alternativt skulle man have en teori for foldning? Men er det overhovedet muligt?

PS: Tak for julekalenderen!

1
14. december 2020 kl. 20:45

Problemet med AI er at den er god til at finde mønstre og siger sandheden. Den er autistisk.

Det har skabt røre, og man forsøger nu at lære den at lyve - den skal blive politisk korrekt.

Man må ikke sige sandheden når det gælder visse grupper, såsom kvinder, indvandrere, sorte, jøder osv. AI skal nu lære at der er forskel på grupper af mennesker. Nogle må man sige alt om, såsom hvide mænd, mens andre nyder beskyttelse mod negative ytringer. Det kaldes "fordomme" eller "bias" når AI finder korrekte mønstre der passer på disse grupper, men som kan opfattes negativt.