Hvis der er én ting, som denne corona-epidemi har lært os, så er det, at der skal være åbenhed omkring de data og modeller, der ligger til grund for myndighedernes vidtrækkende beslutninger.
Det er mere end to måneder siden, Danmark gik i lockdown, og der er endnu ikke blevet fremlagt ét eneste reproducerbart kodeeksempel fra myndighederne for hverken smittetryk eller prognoser.
Det er på trods af, at et flertal i Folketinget tidligere på måneden krævede åbenhed og fremsatte et såkaldt åbenheds-manifest. Et manifest, der lagde vægt på at data og kildekode skulle lægges frem.
Smittetrykket har været et vigtigt tal fra starten og det er blevet brugt til både at begrunde nye politiske tiltag og til at bevise deres effektivitet.
På trods af den vægt, der er lagt på dette tal, er der på intet tidspunkt fremlagt kode eller data, der viser, hvordan SSI beregner smittetrykket.
Derimod er der faldet små krummer af information af hist og pist, der desværre kun tegner et halvt billede af, hvilken metode instituttet bruger og hvilke data.
Smittetrykket er der seneste blevet sat spørgsmålstegn ved i Berlingske Tidende. Avisen har kunnet dokumentere, at der har været en regnefejl i smittetrykket hos SSI i epidemiens tidlige dage.
Hertil kan nævnes, at når jeg selv eller andre forsøger at beregne smittetrykket, så har jeg endnu ikke set nogen version, der visuelt har samme begyndelse som SSI’s graf – netop den begyndelse, der er fremhævet i Berlingske.
Kildekoden og data for de første prognoser, der tog udgangspunkt i to forskellige scenarier (et såkaldt italiensk og et kinesisk) er aldrig blevet lagt frem. Her er der kort sagt intet.
Koden til nogle af de efterfølgende prognoser blev for et par dage siden lagt på GitHub (et sted man deler kode). Der medfulgte også en interaktiv app, hvor man kunne ændre på de forskellige parametre og selv lave sine egne prognoser.
Det er i det hele taget en flot og indbydende app. Problemet er dog, at man i appen ikke kan genskabe de prognoser, der blev fremlagt i de første rapporter – i hvert fald ikke med de standardindstillinger, appen har, når man åbner den.
Appen har nemlig en række indstillinger man kan ændre på – f.eks. hvor længe man er indlagt på hospitalet – og måske kan man ved at ændre på disse indstillinger genskabe den gamle prognose, men så kræver det jo, at de bliver lagt frem, så man ved, hvad de skal ændres til – og det er de ikke.
Jeg er enig i, at der skal være størst mulig gennemsigtighed og åbenhed om de data, der ligger bag myndighedernes beregninger og vurderinger af epidemiens udvikling
--Sundhedsminister Magnus Heunicke (S) i et svar til Berlingske
Fælles for de første og efterfølgende prognoser, var, at de skød rigtigt meget ved siden af. De havde nogle helt vilde estimater for, hvor mange danskere der ville blive indlagt på hospitalerne generelt og i respirator.
Estimater, der næsten allerede den dag, de var publicerede, var forkerte. Derfor havde det fra starten af været godt, hvis der havde været fuld åbenhed omkring data, metoder og kildekode.
I det ovennævnte GitHub repository findes der også kode for, hvordan man beregner de nyeste prognoser. Desværre har de ikke medlagt data for hospitalsindlæggelser, som modellen bygger på, men derimod en fil, hvor de numeriske kolonner er tomme.
Selv forklarer kodens forfattere, at det skyldes at data ikke kan medlægges på grund af GDPR. Det vil altså sige, at her er det heller ikke muligt at se myndigheder efter i kortene og verificere det grundlag de politiske beslutninger vedrørende genåbningen og dets faser bliver truffet på.
Ovenstående konstateringer er nedslående. Epidemiologiske modeller er ikke super avancerede og fylder ikke mange linjers kode. Ej heller er input-data særligt omfangsrigt, da vi i Danmark i det store hele beregner på antal indlagte på lands- og regionsniveau.
Samtidigt ved vi, at de programmerer i det gratis kodesprog R, som alle frit kan downloade og installere. Der er altså intet – absolut intet – til hinder for, at alt data og kode ikke for længst er blevet lagt åbent frem.
