Opgaver der indeholder statistik er spændende, men farlige at arbejde med. God gammel snusfornuft holder ikke altid i dette anti-intuitive univers. Jeg mindes den mere end to måneder lange fejde om juleopgaven i 1987. Jeg måtte involvere en professor i statistik ved KU, Niels Keiding (nu emeritus), i sagen, inden opgavestilleren, ’prof’, gav sig, og indrykkede en undskyldning i nummeret dateret d. 26-02-1988. Interesserede kan læse hele historien i arkivet.
Men denne opgave er vist ikke så giftig. Vi får se! Jeg starter med at fjerne lidt støj i oplysningerne. Oplysningen om at det kun er ca. en sjettedel af mågerne, der er ringmærkede, mener jeg er irrelevant. Desuden bemærker jeg, at det oplyses at numrene er fortløbende, men det fremgår ikke, at numrene nødvendigvis starter med 1 (eller 0 for den sags skyld). Jeg kalder nu det totale antal mærkede måger for T og det søgte antal nedskudte måger for X. Det højeste fundne tal er 107 og det laveste er 7. Det oplyses at X er ca. 10% af T.
For at få et overblik over opgaven starter jeg med at tillade at X og T IKKE er heltal, men blot positive reelle tal. Til gengæld kræver jeg at X er præcis 10% af T. Jeg finder nu at sandsynligheden for at alle tal ligger i det angivne interval er: (98/T)^X
Da vi kun har ét udfald af stikprøven må vi opfatte dette som repræsentativt. Jeg sammenligner derfor den fundne sandsynlighed med en situation, hvor der findes én måge med et nummer udenfor intervallet. Hvis denne sandsynlighed er større, vil forholdet mellem det fundne interval og det totale antal ikke være repræsentativt, men burde være større. Den nævnte situation har en sandsynlighed på:
(98/T)^(X-1)(T-98)/TX. Det drejer sig nu om at bestemme den værdi af X, der medfører at disse to sandsynligheder balancerer, fordi dette giver den mest sandsynlige konfiguration af X og T på den ene side og spredningen af de fundne tal på den anden.
Hvis de to angivne sandsynligheder sættes lig hinanden fås en andengradsligning i X, som dog kun har én positiv løsning: X = 10,7 og følgelig T=107.
Det er nu nærliggende at gætte på at opgavens løsning er X = 11, men for en sikkerheds skyld har jeg kontrolleret med beregninger svarende til ovenstående men med heltal og permutationer.
Jeg finder her ved iteration: X = 10 giver den mest sandsynlige værdi for T = 108, altså X = 9,26 % af T X = 11 giver på samme måde T = 107, altså X = 10,28 % af T X = 12 giver på samme måde T = 107, altså X = 11,27 % af T
Det er altså kun X = 11, der medfører at X er ca. 10 % af T. Med andre ord: Der var 11 nedskudte måger med ringmærke.