AI-app træner danske læger til at opdage af hudkræft

Illustration: Bigstock, DavinQuotes

Der findes mange projekter, hvor kunstig intelligens skal diagnosticere modermærkekræft ud fra et billede af et modermærke, men et dansk projekt går nu et skridt videre – eller til siden.

»Det er ikke vores primære sigte at kategorisere, hvorvidt et modermærke er godartet eller ondartet. Vi sigter mod at estimere, hvor svært et givet billede er at forstå for et menneske,« siger Anders Nymark Christensen, lektor ved DTU Compute.

Han er med i et dansk samarbejde mellem forskere, virksomheder og sundhedsvæsen om at bruge kunstig intelligens til at udvikle lærings­systemer til hudkræftdiagnostik.

For når der er så mange projekter med kunstig intelligens og modermærker, er det, fordi det ligner det perfekte match mellem teknologi og samfundsbehov: Man pudser maskinlæring på modermærkebilleder og skaber den perfekte algoritme til at diagnosticere hudkræft, så vi ikke længere behøver at snitte 75 uskadelige modermærker ud af kroppen på raske mennesker for at finde blot ét modermærke med kræft.

Feedback og læring

Desværre virker det ikke på den måde – tværtimod.

»Vi prøver ikke at erstatte ­lægen. Det har mange forsøgt, og det fun­gerer ikke i praksis. Vi prøver i stedet at gøre lægen bedre,« siger Anders Nymark Christensen, og netop den sætning placerer projektet i særklasse: I stedet for at udvikle en app til befolkningen, så vi selv kan kræfttjekke vores modermærker med mobilen, henvender dette projekt sig til læger, og det skal bruges i sundhedssystemet til feedback og læring samt til beslutningsstøtte i det daglige arbejde i klinikken.

»Ofte sidder den unge læge alene med en svær case og vil gerne spørge en erfaren kollega til råds. Det er den støtte, vi gerne vil give. Appen på mobilen skal være den erfarne kollega, som altid har tid,« siger Anders Nymark, som blev involveret i projektet, da han mødte lægen Niels Kvorning Ternov gennem en fælles bekendt.

Niels Kvorning Ternov er projektleder for AISC Research Consortium, som er stiftet for at udvikle brugen af kunstig intelligens til træning og beslutningsstøtte i hudkræftdiagno- stik – det fulde navn på samarbejdet er Artificial Intelligence augmented training and feedback in Skin Cancer diagnostics.

Sidste efterår gav Innovationsfonden ham en stor bevilling til at udvikle en app, Dermloop, der bruger kunstig intelligens og visuel feedback til at gøre lægerne bedre til at diagnosticere hudkræft.

DuoLingo for læger

»Jeg kalder det DuoLingo for læger. Det er et quizmiljø, som er koblet til en hulens masse læringsmateriale, som er optimeret med en kunstig intelligens,« siger Niels Kvorning Ternov, der har samlet kapaciteter fra flere universiteter og forsknings- områder om projektet, der allerede er ‘ude i klinikken’ i forsøg.

Indtil december er Niels Kvorning Ternov også selv ph.d.-studerende under AISC-projektet, og for tiden er han i gang med at afprøve den generelle læringsplatform i Dermloop på australske og danske lægestude­rende i et studie, som skal udgøre den anden halvdel af hans ph.d. Første del gik ud på at etablere en standardiseret test af lægers kompetencer i hudkræftdiagnostik.

Studiet viste, at medicinstuderende og nyuddannede læger har samme kompetenceniveau som reserve­læger med tre-seks års erfaring. Efter seks år stikker hudlægerne og plastikkirurgerne af fra de praktise­rende læger – ganske enkelt fordi de to specialer ser mange flere modermærker om året. Og studiet demonstrerede, at på dette område er det kun øvelse, der gør mester.

Datagrådige neurale netværk

Det samme gælder for ­neurale netværk, der øver sig – eller maskin- lærer – på enorme datamængder.

De fleste modermærke-apps er trænet på et datasæt fra det internationale lægesamarbejde om at lægge billeder af hudforandringer ind i en fælles database, ISIC (International Skin Imaging Collaboration).

»Det viste sig, at hvis vi træner vores model på ISIC-data, så virker den ikke i dansk sammenhæng, og de internationale algoritmer klarer sig heller ikke godt, hvis de afprøves på vores danske datasæt,« siger Anders Nymark Christensen.

DTU-forskerne træner deres modeller på et datasæt fra Odense Universitetshospital af modermærkebilleder med diagnostiske oplysninger, som er opsamlet gennem mange år.

»Det er et meget stort datasæt, men det er også karakteristisk for dyb læring og neurale netværk, at de er datagrådige, og med appen vil vi løbende få endnu flere data ind,« siger Anders Nymark Christensen.

Efterhånden som der kommer flere brugere, flere billeder og flere diagnoser, vil appen ret hurtigt kunne samle data ind til at blive blandt de største – hvis ikke den største – database i verden med billeder i klinisk kvalitet af hudforandringer med tilhørende diagnostiske oplysninger.

Embedding space

Datasættet skal fodre en særlig udgave af maskinlæring, et embedding neural network, hvor billederne placeres i et 32-dimensionelt rum.

»Det er helt op til netværket selv, hvad den har på de her 32 forskellige akser. Det lærer den under træningsprocessen, og det er ikke nødvendigvis egenskaber, der er fortolkbare for et menneske,« siger Anders Nymark Christensen.

Det er her, udtrykket ‘black box’ plejer at dukke op, når man taler om neurale netværk, men i dette tilfælde er klassifikationerne ikke interessante i sig selv, og de skal ikke ses som paralleller til et nyt diagnostisk kriterie for modermærkekræft. Forskerne er alene interesserede i at få placeret billederne i forhold til hinanden efter deres udseende.

»Når billederne er organiseret i det her embedding space, så ved vi, hvor langt de ligger fra hinanden. Det betyder, at netværket ikke kun kan fortælle os, at dette er et billede af et godartet modermærke og dette er ikke. Vi kan se, hvilke billeder der ligner hinanden meget, og hvilke der er meget forskellige. Det kan vi bruge til at udvælge det bedste læringsmateriale,« siger Morten Hannemose, DTU Compute, der er tilknyttet projektet som postdoc.

Med den viden skal netværket bidrage til at vælge billeder til det optimale læringsmateriale til læger på forskellige kompetenceniveauer. Den enkelte læge får skræddersyet sit feedback, så det kan træne de svage punkter, og de meget erfarne læger kan presses med vanskelige opgaver, dvs. med de billeder, som netværket har lært, at lægerne har sværest ved at diagnosticere korrekt.