Så lille er Danmarks chance ved VM
Se hvordan et 'bayesiansk net' kan bruges til at beregne den præcise sandsynlighed for, at Danmark når bestemte stadier i VM-turneringen.
(Klik for stort billede) Figuren viser et bayesiansk net for Danmarks chancer for at kvalificere sig til de videre kampe efter indledende runde mod Holland (NL), Cameroun (CM) og Japan (JP). De bokse, hvis overskrift står på grå baggrund er såkaldte forældrevariable, der påvirker udfaldet af de variable, hvis overskrift står på gul baggrund (kampvariable).
I knockout-runderne er udfaldet enten, at vi går videre, eller at vi ryger ud, og her indeholder forældrevariablen de mulige modstanderhold, f.eks. Italien, Paraguay, New Zealand eller Slovakiet i en evt. ottendedelsfinale.
Bag bokse og pile er de betingede sandsynlighedstabeller, der definerer de initielle sandsynligheder, der er vist som vandrette søjler i figuren, og som bruges til at opdatere nettets sandsynlighed ud fra Bayes’ sætning.
Det sker f.eks. ved tilføjelse af evidens (f.eks. hvis Holland og Danmark spiller uafgjort i den første kamp), som så indregnes i de øvrige sandsynlighedsfordelinger.
Boksen med overskrift på lyseblå baggrund er en slags milepælsvariabel, der holder styr på, om Danmark slutter som nr. 1, 2 eller 3-4 efter den indledende runde, afhængigt af de 6 kampe i den indledende runde i Danmarks pulje.
Bayesianske net
Læs også
-
Nyt storage-system hos TV2 Sputnik skal stå sin prøve ved VM-kamp
Læs mere om
Dokumentation
VM i fodbold er i gang i Sydafrika - og de fleste kan vel blive enige om, at Danmark ikke ligefrem står med begge ben i finalen. Men bruger man data fra FIFA's hjemmeside samt enkelte subjektive skøn som baggrund for et såkaldt bayesiansk net, kan man få et mere præcist billede af Danmarks chance for at vinde VM: Den er så lille som 1,4 procent - eller 1:72.
Det vil sige, at hvis du vælger at sætte dine spareskillinger på, at Danmark vinder VM, så skal du finde et bettingfirma, der giver dig pengene 72 gange igen.
Vælger du at spille på Danmarks chancer for at komme videre fra den indledende pulje, så skal du have pengene godt 2 gange igen, hvis du får ret, for her er chancen knap 43 pct.
Et bayesiansk net består af et antal knuder, kanter og sandsynlighedstabeller. Det bayesianske fodbold-VM-net fokuserer på Danmarks chancer i VM-turneringen og beskriver sandsynligheden for, at vi når de næste stadier i turneringen - f.eks. bliver nummer et eller to i den indledende runde osv.
De vigtigste knuder er her Danmarks tre indledende kampe mod Holland, Cameroun og Japan i nævnte rækkefølge. Skjult i maskinrummet bag den grafiske model (se illustration) ligger så de stakke af sandsynlighedstabeller, der holder styr på de indkodede betingede sandsynligheder, som er kernen i et bayesiansk net, hvor man til enhver tid kan tilføje evidens til de enkelte knuder og ved hjælp af 'Bayes' sætning' (deraf navnet) opdatere samtlige sandsynligheder.
Logik og viden
For at den konstruerede grafiske model skal være så pålidelig og objektiv som muligt, er det vigtigt, at samtlige knuder, kanter og sandsynlighedstabeller bygger på den logik og den viden, der foreligger om holdenes indbyrdes styrkeforhold. Samtidig er der dog altid nogle hjælpevariable, eller hypoteser, som vil være af mere subjektiv karakter, og det er der også i fodbold-VM-nettet.
Det er f.eks. knuderne, der angiver 'holdets teamsituation/skadede spillere' og 'trænerens taktiske formåen'. Disse variable har tre mulige tilstande, enten at Danmark har en bedre, en ligeværdig eller en dårligere teamsituation end modstanderen. Eller at Morten Olsen er bedre end, lige så god som eller dårligere end modstanderholdets træner.
Disse variable er det, man kalder 'forældrevariable' til Danmarks kampe i den indledende runde, og initielt er de tildelt en sandsynlighedsfordeling, sådan som situationen aktuelt vurderes for de pågældende kampe før VM går i gang.
Kanterne slibes af
De fleste kanter i nettet og de fleste tilstandsvariable for mulige modstanderhold i de enkelte knuder er slebet af henholdsvis FIFA's spilleregler og den logik, der præger en VM-turnerings regelsæt.
Det ligger således fast, hvilke fire hold, Danmark vil kunne møde i en evt. ottendedelsfinale. Lige så nagelfast er det, at vi i en evt. kvartfinale med størst sandsynlighed vil møde et af otte veldefinerede hold.
I beregningen af de indbyrdes sandsynligheder for, at Danmark vinder eller taber til de forskellige hold, benyttes som vægt forholdet mellem de to holds point på FIFA's egen rangliste. Det fine ved FIFA's ranglistepoint er, at det er en relativt objektiv måde at fastsætte sandsynligheder for, hvem der vinder de enkelte kampe, og at det, at listen opdateres løbende, gør, at en evt. ændring i et holds styrke dermed indbygges i prognosen, der altså kan udvikle sig med et holds udvikling eller nedtur.
F.eks. lå Danmark nr. 17 på listen i juli 2009, men er siden faldet ned på en 36. plads. Den kurve skulle gerne vendes allerede i den indledende runde, hvis vi skal rocke med Nephew helt frem til 11. juli.
Slutkampene
Ifølge det bayesianske net er chancen for, at vi når: en kvartfinale 8 pct., en semifinale 4 pct. og finalen 1,4 pct. Det skyldes bl.a., at Danmark i denne turnering er 'underdog', og derfor står med dårlige odds på hånden, når man indregner såvel sandsynligheden for at møde en af disse modstandere, som chancen i det indbyrdes opgør.
Efterhånden som det bliver afgjort, hvem vi konkret skal møde, kan disse knuder med modstanderhold opdateres med evidens, og på den måde indsnævres sandsynlighedsfeltet for, at Danmark når sejrrigt til finalen - eller ryger ud.
En anden mulighed ved et bayesiansk net er, at man kan stille 'what if'-spørgsmål og få nettet til at besvare dem som et andet orakel fra Aalborg (hvorfra de forskere kommer, der har udviklet et af verdens førende programmer til konstruktion og beregninger med bayesianske net, Hugin - se hugin.com).
Det er også nyeste version af Hugin, der anvendt ved konstruktionen af fodbold-VM-nettet, som er et forholdsvis simpelt net, der langt fra udnytter alle de muligheder man har, når man skal konstruere pålidelige og raffinerede bayesianske net, der kan gribe de komplekse problemstillinger og hjælpe os med at holde styr på dem oppe i vores hoveder.
Lad mig slutte med et eksempel på, hvordan man bruger nettet til at svare på 'what if'-spørgsmål. Hvad nu, hvis Holland vinder 14. juni mod Danmark, hvordan er så Danmarks chancer? Med en sådan tænkt forudsætning reduceres chancen for, at vi vinder finalen til 0,9 pct., mens chancen for, at vi når ottendedelsfinalen falder fra 43 pct. til 27 pct.
Men hvis Danmark vinder mod Holland 14. juni - ja, så stiger chancen for, at vi vinder finalen til ikke mindre end 2,7 pct., og chancen for, at vi når ottendedelsfinalen, stiger til hele 79 pct. Prøv selv via linket under 'Eksterne links' herunder at indtaste dine bud på resultaterne af kampene i Danmarks pulje i den indledende runde og se Hugins opdaterede bud på de videre sandsynligheder.
Forkortet - læs hele artiklen i den trykte udgave af Ingeniøren.






