Tænkeboks: Hvor mange ringmærkede måger blev dræbt?

Illustration: Ingeniøren

Denne uges opgave kommer fra opgavestiller Morten Grud Rasmussen fra Institut for Matematiske Fag ved AAU og lyder:

Opgave 41: En kriminel undergrundsorganisation i en mellemstor dansk by har besluttet sig for at gøre det af med byens måger. For at skjule deres spor, indsamler de de myrdede måger.

Men nu går det op for dem, at en lokal biolog har været i gang med at ringmærke bestanden, så ca. en sjettedel af mågerne har den samme kode plus et angiveligt fortløbende serienummer på en ring om foden.

Under en diskussion i deres skumle kælderrum kommer mågemorderne til at tale om disse numre, og de når frem til, at det laveste nummer, de har observeret, er 7, og det højeste nummer, de har observeret, er 105.

Baseret på dette, estimerer de, at de må have dræbt ca. 10 % af alle mågerne.

Opgaven lyder nu: Estimér antallet af dræbte måger med ringmærke.

– – –

Vi bringer løsningen i næste uge, men fra søndag eftermiddag ligger opgaven også på adressen ing.dk/ fokus/taenkeboksen, hvor I kan diskutere jeres forslag til løsninger.

Illustration: Ingeniøren
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Opgaver der indeholder statistik er spændende, men farlige at arbejde med. God gammel snusfornuft holder ikke altid i dette anti-intuitive univers. Jeg mindes den mere end to måneder lange fejde om juleopgaven i 1987. Jeg måtte involvere en professor i statistik ved KU, Niels Keiding (nu emeritus), i sagen, inden opgavestilleren, ’prof’, gav sig, og indrykkede en undskyldning i nummeret dateret d. 26-02-1988. Interesserede kan læse hele historien i arkivet.

Men denne opgave er vist ikke så giftig. Vi får se! Jeg starter med at fjerne lidt støj i oplysningerne. Oplysningen om at det kun er ca. en sjettedel af mågerne, der er ringmærkede, mener jeg er irrelevant. Desuden bemærker jeg, at det oplyses at numrene er fortløbende, men det fremgår ikke, at numrene nødvendigvis starter med 1 (eller 0 for den sags skyld). Jeg kalder nu det totale antal mærkede måger for T og det søgte antal nedskudte måger for X. Det højeste fundne tal er 107 og det laveste er 7. Det oplyses at X er ca. 10% af T.

For at få et overblik over opgaven starter jeg med at tillade at X og T IKKE er heltal, men blot positive reelle tal. Til gengæld kræver jeg at X er præcis 10% af T. Jeg finder nu at sandsynligheden for at alle tal ligger i det angivne interval er: (98/T)^X

Da vi kun har ét udfald af stikprøven må vi opfatte dette som repræsentativt. Jeg sammenligner derfor den fundne sandsynlighed med en situation, hvor der findes én måge med et nummer udenfor intervallet. Hvis denne sandsynlighed er større, vil forholdet mellem det fundne interval og det totale antal ikke være repræsentativt, men burde være større. Den nævnte situation har en sandsynlighed på:

(98/T)^(X-1)(T-98)/TX. Det drejer sig nu om at bestemme den værdi af X, der medfører at disse to sandsynligheder balancerer, fordi dette giver den mest sandsynlige konfiguration af X og T på den ene side og spredningen af de fundne tal på den anden.

Hvis de to angivne sandsynligheder sættes lig hinanden fås en andengradsligning i X, som dog kun har én positiv løsning: X = 10,7 og følgelig T=107.

Det er nu nærliggende at gætte på at opgavens løsning er X = 11, men for en sikkerheds skyld har jeg kontrolleret med beregninger svarende til ovenstående men med heltal og permutationer.

Jeg finder her ved iteration: X = 10 giver den mest sandsynlige værdi for T = 108, altså X = 9,26 % af T X = 11 giver på samme måde T = 107, altså X = 10,28 % af T X = 12 giver på samme måde T = 107, altså X = 11,27 % af T

Det er altså kun X = 11, der medfører at X er ca. 10 % af T. Med andre ord: Der var 11 nedskudte måger med ringmærke.

  • 0
  • 0

Hej Kim. Tak for spørgsmålet. Det afslører, at der er en skrivefejl i mit referat af opgaven. Der skulle jo ikke stå 107 men 105! 98 fremkommer nu som 105-7. Bemærk at der på dette sted ikke regnes med heltal, så spørgsmålet om hvorvidt udfaldene 7 og 105 skal regnes inklusive eller eksklusive er ikke relevant. Det viser sig iøvrigt senere, at det giver samme resultat i heltalsberegningerne om de regnes på den ene eller anden måde!

  • 0
  • 0

jeg er ikke stiv i statistik, men det behøver man heldigvis heller ikke at være for at deltage. For ikke at få for mange ubekendte, antager jeg at nummereringen starter ved tallet 1. Jeg regner med p dræbte måger ud af en bestand på n, begge regnet ud over de 2 kendte 7 og 105. Så er min udokumenterede tese, at sdandsynligheden er 1/2 for at alle dræbte måger har et nummer mindre end 7. Sandsynligheden for at næste måge opfylder dette er (106-8+1)/(104-1) = 97/103 (husk at nr, 5 ikke er til rådighed mere). Med p = 11 får vi [latex] \qquad \qquad s_1 = \frac{97}{103} \cdot \frac{96}{102} \cdot \cdot \cdot \frac{87}{93} = 0.499 [/latex] Tilsvarende er sandsynligheden ifølge tesen 1/2 for at alle 11 måger har et nummer større end 105 [latex] \qquad \qquad s_2 = \frac{97}{n-7} \cdot \frac{96}{n-8} \cdot \cdot \cdot \frac{87}{n-17} = 0.5 [/latex] Sammenligning med første formel giver nu n = 110 og dermed en bestand på 110 + 2 = 112 måger. Dog uden garanti for rigtigheden. Oplysningen om 10% fik jeg ikke brug for.

  • 0
  • 0

Jeg kalder nu det totale antal mærkede måger for T og det søgte antal nedskudte måger for X. Det højeste fundne tal er 107 og det laveste er 7. Det oplyses at X er ca. 10% af T.

Det generer mig lidt at den sjettedel der er mærkede skulle være uden betydning. Men det er selvfølgelig rigtigt, at hvis de har skudt 10% af mågerne, må der også være 10% af T (de mærkede måger) blandt de skudte, forudsat at ingen af dem er døde af andre årsager undervejs, eller fløjet bort.

Jeg selv nåede kun til at X som minimum måtte være 2.

Jeg finder nu at sandsynligheden for at alle tal ligger i det angivne interval er: (98/T)^X

Kan du forklare denne udledning?

  • 0
  • 0

Hej Svend

ang. citat 1: Bemærk at der er en trykfejl. Der skulle have stået henholdsvis 105 og 7. ang. citat 2: Jeg benytter blot at det samlede løsningsrum har størrelsen T og det aktuelle udfaldsrum har størrelsen 105 - 7 = 98. Så ved hvert skud er sandsynligheden for at skyde en fugl med en nummer mellem 7 og 105 = 98/T, Ved X ramte fugle er sandsynligheden for at alle ligger i intervallet = (98/T)^X.

  • 1
  • 0

Så vidt jeg kan gennemskue finder du det antal, der gør at det givne udfald har størst sandsynlighed, og det er en helt ok metode. Jeg gik istedet vejen at prøve at placere normalfordelingskurven, men så skal du antage et signifikansniveau og det kunne ikke være i den hvide plads på bagsiden ...

  • 0
  • 0

Vores forbrydervenner antages ikke at være professorer i sandsynlighedsregning og statistik. Derfor tænker de:

Vi antager at løbenummer starter med 1 og er fortløbende. Vi var således 6 over med vores laveste nummer, så vi er nok også 6 under det højeste nummer. Det vil sige det højeste nummer er 105+6 = 111. Med andre ord er der 111 måger med ringmærke. På byttebordet ligger der 11 måger hvorfor de konkluderer at de har skudt 10% af (alle) mågerne,

Svaret er : Cirka 11 dræbte måger med ringmærke.

  • 1
  • 0

Ved at forvente symmetri af de to givne numre, får man et let og hurtig bestemmelse af antallet af ringmåger til 111. Men det har de ulemper, at man dels ikke kan forvente symmetri med så få data som ca. 10 og dels at der slet ikke tages i betragning, at data gælder for præcis 1/10 af en population. Jeg har forsøgt mig med en Monte Carlo bestemmelse. Det vil sige, at jeg vælger antallet til fx. 110 og dernæst udtrækker 11 (1/10) tilfældige tal og noterer mig minimum og maksimum. Det gentager jeg 100.000 gange (på computeren!) og tager middelværdier af både min oh max. Desværre kan jeg kun arbejde med antal delelige med 10, så jeg prøver med 100, 110 og 120 og interpolerer. Desuden prøver jeg både med 0 og med 1 som første nummer. Her er resultaterne: [latex] \quad \; \; antal \quad \; min0 \qquad max0 \qquad \quad\;\; min1 \qquad max1 [/latex] [latex]\qquad 100 \qquad 8.58 \qquad \; \, 90.40 \qquad \qquad 9.59 \qquad \; \, 91.43 [/latex] [latex] \qquad 110 \qquad 8.64 \qquad 100.29 \qquad \qquad 9.67 \qquad 101.34 [/latex] [latex] \qquad 120 \qquad 8.72 \qquad 110.30 \qquad \qquad 9.74 \qquad 111.32 [/latex] Man ser ved akstrapolation, at vi kun kan opnå minimumsværdien 7 hvis nummereringen begynder ved ca. -1,5. Lader vi den begynde med den mere praktiske værdi 0, giver en interpolation, at antallet af ringmåger skal være ca. 117 for at pnå en maksimalværdi på 107. Gad vide, om opgavestilleren har været så drilsk at vælget startnummeret til -1 eller -2 for at få en bedre overensstemmelse?

  • 0
  • 1

Jeg selv overvejede noget med en poisson fordelig og noget Bayes, men det er måske dømt ude. Jeres løsninger virker rimelige, selvom jeg ikke lige har gennemskuet dem. Jeg tænker stadig over om oplysningen om 1/6 del af mågerne er ringmærkede skulle indgå.

  • 0
  • 0

Hej Børge

Spændende beregninger! De passer ikke så godt med mine - så det må jeg hellere se nærmere på! PS: Hvad er det for et program du skriver data i? Det ser godt ud.

  • 0
  • 0

MC lyder som en god mulighed. Jeg kommer frem til, at det span der giver størst sandsynlighed for 7 og 105, er -3 til 115 dvs. 119 ringmåger. Udbyttet af jagten er 12 ringmåger og 60 måger uden ring - cirka.

  • 0
  • 0

Hej Ebbe

Tak for din ros. Mit skema er blot 3 separate formellinjer under hinanden. De vandrette justeringer er der mange koder til med forskellige output, bla. \, \; \quad og \qquad (i voksende rækkefølge). Jeg har til eget brug skrevet et skema med de 20 mest anvendte formelkoder. Du (og andre) er velkomne til at få et eksemplar ved at maile til howald@mail123.dk.

Hej Erling

Med startnummeret -3 får jeg slutnummeret til 119, dvs 123 ringmåger. I dit program studser jeg over 2 ting. Du regner med 10 skudte måger selv om det er ca. 11. Og så mener jeg, at din integer-funktion skal slutte med Low - 1/2 i stedet for Low. Ellers optræder Low-værdien for sjældent og du kan få værdier større end High.

Med venlig hilsen

Børge

  • 0
  • 0

Hej Børge,

Tak for dine inputs. Ja det er rigtigt, antal skudte måger afhænger af hvor mange måger der er i flokken (10%). Ved 11 hhv. 12 skudte måger bliver rækken -2 til 114 og -1 til 113 Den sidste rækker har 115 måger, det giver 11,5 skudt måge, som rundes op til 12.

Jeg har checket random linjen med lidt statistik og jeg får 'lige mange' min og max svar og ingen udenfor. Mine rækker er tæt på symmetriske om de opgivne numre - mens din række er skubbet mod den høje ende. Hvad kan årsagen være til asymmetri.

  • 0
  • 0

Hej Erling

Jeg ser teoretisk på det ved at læse dit program. Din integer-oarentes kan ikke blive mindre end Low i stedet for mit forslag Low - 1/2, hvilket betyder at Low kun optræder med halv sandsynlighed. Tilsvarende kan din parentes blive High + 1, hvilket giver værdier uden for definitionsintervallet, eller, om man vil, værdien High med 50% forstørret sandsynlughed. Ved at påføre mit -1/2 kommer begge dele i orden.

Med venlig hilsen Børge

  • 0
  • 0

Tænkeboks opgave 41:

Forudsat at alle numre på ringmærkede måger - og ikke ringmærkede måger - var lige lette at skyde, og ringmærke nummeret på dræbte fugle er ligeligt fordelt.

Da mindste nummer 7 er under nr. 10 er formodentlig startet ved nr. 1

Antal fugle i alt X

Antal dræbte fugle Y

X = 10 * Y og Estimat på største ring nummer på fugl er 105 + (X/(2*Y))

Medfører:

Antal fugle er 6 gange antal ringmærkede X = 6 * ( 105 + 5 ) = 660 fugle.  

Antal døde fugle Y = 66 fugle.

Antal ringmærkede døde fugle Y/6= 11 fugle.

  • 1
  • 0

Jeg har rettet en fejl i min programmering, hvorved der skal trækkes 0,5 fra alle værdier i mit tidligere viste skema . På grund af den stærke linearitet i både vandret og lodret retning på skemaet, kan jeg ekstrapolere til at nummereringen skal begynde med -2 . Højeste mågenummer kan på grund af symmetrien bestemmes af 7-(-2) = 9 og 107 + 9 = 114. Der var altså 117 ringmåger, hvoraf 11,7 blev skudt. Numrene 7 og 105 bliver i beregningen repræsenteret ved 6,7 og 105,3. Underligt startnummer, men det kan ikke vildlede en ingeniør!

  • 0
  • 0

Hej Børge Jeg har haft lidt tidsnød og har ikke fulgt med i MC-diskussionen. Jeg er nu også lidt loren ved den. Gennemsnitsværdier af max og min giver måske ikke så meget mening. numrene er jo ikke værdier med blot koder. De kunne lige så godt have været fortløbende bogstaver. Jeg er tilbage ved simpel sandsynlighedsregning, hvor det angivne udfaldsrums bredde bliver afgørende fordi det oplyser hvor mange mulige måder, de øvrige nedskudte måder er udvalgt iblandt, og dermed hvor mange mulige, der IKKE har været relevante. Jeg vender således tilbage til den metode som du brugte den 30/11 kl. 14.49. Med enkelte modifikationer finder jeg at sandsynligheden for den angivne fordeling er tættest på 0,5 ud fra denne formel: S = 97!/(97-X)!*(T-2-X)!/(T-2)! Jeg finden parrene: X = 10, T= 106 (9,43%) og X= 11, T= 105 (10,48%) X=11 er altså det bedste bud på at antallet af nedskudte, ringmærkede måger er ca. 10% PS: tak for løftet om koder til at skrive formler. Det vender jeg tilbage til!

  • 0
  • 0

Hej Børge,

Helt ok og igen tak for inspiration. 'Int' tager heltalsdelen - uden afrundning, derfor går det godt.

Tænker at du tager udgangspunkt i 11 måger. Jeg kommer frem til at spandet bliver smallere jo flere måger der er blevet skudt.

Hvis jeg tager udgangspunkt i:

10 måger fås spand til -3 til 115 = 119 dvs. 11,9 (12 afrundet) skudt måge

11 måger fås spand til -2 til 114 = 117 dvs. 11,7 (12 afrundet) skudt måge

12 måger fås spand til -1 til 113 = 115 dvs. 11,5 (12 afrundet) skudt måge

Derfor mener jeg at det er 12 ringmåger der er blevet skudt. Men det kommer nok an på hvordan og hvornår der afrundes. Ser frem til opgavestillerens løsning (og resultat).

  • 0
  • 0

Hej Ebbe

Her kommer et forsinket svar fordi sitet tidligere flere gange slettede mit indlæg når jeg bad om en forhåndsvisning (censur?).

Jeg er kommet til den overbevisning, at resultatet af en MC-beregning er nødt til at være korrekt på nær en beskeden unøjagtighed. Det er godt nok en utilfredsstillende løsning bare at lade komputeren arbejde uden at man alternativ forsøger at tænke sig igennem problemet. Jeg approberer fuldstændigt din nye fremstilling, men må alligevel baseret på MC-resultatet afvise metoden. Jeg foreslog jo i mit første indlæg, at når et tal skulle have en vis værdi, så ville sandsynligheden være ca. 1/2 for at værdien blev henholdsvis mindre eller større, men det giver tilsyneladende en modstrid med MC. Så den tese er nok ikke rigtig.

Det bliver spændende at se, hvad vor klasselærer skriver i morgen. Måske har han nogle fede beregningsformler i stedet for vor computerløsning, så vi allesammen bare ikke har været kloge nok?

  • 0
  • 0

Hej Ebbe

Her kommer et forsinket svar fordi sitet tidligere flere gange slettede mit indlæg når jeg bad om en forhåndsvisning (censur?).

Jeg er kommet til den overbevisning, at resultatet af en MC-beregning er nødt til at være korrekt på nær en beskeden unøjagtighed. Det er godt nok en utilfredsstillende løsning bare at lade komputeren arbejde uden at man alternativ forsøger at tænke sig igennem problemet. Jeg approberer fuldstændigt din nye fremstilling, men må alligevel baseret på MC-resultatet afvise metoden. Jeg foreslog jo i mit første indlæg, at når et tal skulle have en vis værdi, så ville sandsynligheden være ca. 1/2 for at værdien blev henholdsvis mindre eller større, men det giver tilsyneladende en modstrid med MC. Så den tese er nok ikke rigtig.

Det bliver spændende at se, hvad vor klasselærer skriver i morgen. Måske har han nogle fede beregningsformler i stedet for vor computerløsning, så vi allesammen bare ikke har været kloge nok?

  • 0
  • 0

Boye

Det var den enkleste løsning, og også den som stod i avisen. Det er jo simpelt at vurdere hvor mange måger kratluskeren kan have mærket. Det er minimum 105 og lidt til, for ellers havde de haft en fugl med et højere nummer.

  • 0
  • 0
Bidrag med din viden – log ind og deltag i debatten