Tænkeboks: Estimat - der blev dræbt 11 ringmærkede måger

Illustration: Ingeniøren

I årets sidste opgave fra Morten Grud Rasmussen fra Institut for Matematiske Fag ved AAU havde en kriminel bande besluttet sig for at gøre det af med byens måger, men en lokal ornitolog havde ringmærket bestanden, så ca. en sjettedel af mågerne har den samme kode plus et angiveligt fortløbende serienummer på en ring om foden.

Mågemorderne når frem til, at det laveste nummer, de har observeret, er 7, og det højeste nummer, de har observeret, er 105. Baseret på dette, estimerer de, at de må have dræbt ca. 10% af alle mågerne, og med disse oplysninger skulle I estimere antallet af dræbte måger med ringmærke.

Løsning: Vi estimerer først det samlede antal ringmærkede måger til at være 105+7-1=111; der er 6=7-1 tal, der er lavere end 7, og hvis vi gætter på, at nummereringen begynder ved 1, så er det vores bedste bud på, hvor langt det højeste, observerede tal 105 er fra det højeste nummer.

Hvis hver sjette måge er ringmærket, så giver det en bestand på 6 x 111, hvoraf de har dræbt 10% eller omkring 67 måger.

Altså må de have dræbt ca. 11≈67/6 måger med ringmærke. Alternativt kunne man, når man var nået frem til de 111, blot have taget 10% af dette tal. Interessant nok ville information om 11 dræbte, ringmærkede måger sammen med tallet 105 have givet et lidt højere estimat på det totale antal måger.

Dette er en variation over problemet, som på engelsk er kendt som ‘The German tank problem’.


Alle opgaver og deres løsninger kan efterhånden findes på ing.dk/fokus/taenkeboksen

I næste uge udkommer vi med magasinet ‘Året Rundt’, og vi bringer en ny opgave, når papirudgaven af Ingeniøren udkommer igen efter juleferien den 15. januar.

Illustration: Ingeniøren
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Opgavestilleren løser sin opgave ved at begynde nummereringen ved 1. Det er en meget naturlig start, men opgaveteksten siger kun at numrene er fortløbende. Denne tilsnigelse benytter opgaveløseren til at ignorere den meget vigtige oplysning, at 7 og 105 er mindste og største værdi af de skudte måger. Sådan kan man ikke lege med oplysningerne!

En Monte Carlo analyse er ikke særlig videnskabelig, men den giver det rigtige resultat med meget lille fejlmargin. Når jeg kører 100000 tilfælde med opgaveløsningens tal, bliver minimum og maksimum 9,7 0g 102,3 , hvilket er meget langt fra 7 og 105. En fjollet, men korrekt, løsning må være min MC-løsning, der giver 117 måger med minimum og maksimum på 6,7 og 105,3. Opgavestillerens kommentar er påkrævet!

  • 0
  • 1

Jeg finder den angivne løsning upræcis at to grunde:

  1. Den antager at nummereringen starter ved 1, selv om denne oplysning omhyggeligt er undladt i opgaveteksten.

  2. Den gør ikke nærmere rede for under hvilke omstændigheder og hvordan det findes at 11 dræbte og tallet 105 giver ’et lidt højere estimat for det samlede antal’.

Der ligger dog sikkert et hint i henvisningen til ’The German tank problem’. I linket https://web.williams.edu/Mathematics/sjmil...

har jeg fundet disse to formler: (men det fremgår andetsteds, at de ikke er det eneste bud på en løsning!) (1) T = m(1 + 1/X) – 1 og (2) T = s( 1 + 2/(X-1)) - 1

I den første antages at numrene starter ved 1. m er det højeste fundne nummer og X er antallet er nedskudte måger. Jeg finder her at X = 11 og T = 114 (9,6%) giver det bedste bud. I den anden kendes startnummeret ikke og s angiver forskellen mellem største og mindste fundne tal. Her får jeg X = 12 og T = 116 (10,34 %) til at være bedste bud.

Det gør således efter min mening er forskel for løsningen om startnummeret kendes eller ej.

  • 0
  • 1

Nu har jeg været på williams.edu og læst om tankproblemet. Her står en formel for det forventede antal tanks når man kender både minimum og maksimum, hvilket vi gør. Det er [latex] \qquad \qquad n = \Delta m \left( 1 + \frac{2}{k-1} \right) = (105 - 7) \cdot \left(1 + \frac{2}{11 - 1} \right) = 117 [/latex] Dette svarer helt til mit MC-resultat.

  • 0
  • 0

Hej Erling

Ja det skulle være X=12, T=115 (10,4%) Jeg mener vi er nødt til at afrunde både X og T til heltal. Men konklussionen bliver den samme.

Hej Børge

Jeg mener både k og T skal være heltal, men din MC beregning holder vand!

  • 0
  • 1

Lidt overvejlelser.

Løsningen på 'Uge48', den oprindelige: (Input er Min=7, Max=105 og 10%) giver en serie på 115 (-1 til 113), 10% giver 11,5 som afrundes til 12 skudte måger.

Løsningen på 'Uge49A', en anden mulig opgave: (Input er Start=1, Max=105 og 10%) giver en serie på 114 (1 til 114), 10% giver 11,4 som afrundes til 11 skudte måger. (Her bliver Min=10)

Disse løsninger fås både ved Monte Carlo iteration og ved brug af TGTP formler (spændende historie). Det er en hårfin forskel - godt begge løsningsmetoder giver samme resultater. Jeg mener ikke det er estimater, men eksakte løsninger hvor sandsynligheden er størst.

Løsningen med 'rå' symmetri 'Uge49B': (Input er Start=1, Min=7, Max=105 og 10%) giver en serie på 105+7-1=111 (1 til 111), 10% giver 11,1 som afrundes til 11 skudte måger. Denne løsning er ikke gangbar - informationerne er overbestemt. Der er for mange informationer og tallene hænger ikke statistisk sammen - Min=10, ville give sammenhæng. Derfor kommentaren i svaret om at serien burde være større - den burde være 114 som vist i 'Uge49A' ovenfor.

Tak for opgave(r), input og inspiration.

  • 0
  • 1

Hej Erling. God idé at prøve lidt overblik. Jeg ser det selv sådan, at hvis vi antager at jægerne er praktiske folk, som ikke har hverken viden eller lyst til at nørde med statistik, så bruger de antagelsen om symmetri – og ender med 111 måger med ringmærke. Hvis det på den anden side er sådan at et par stykker af dem, der synes det er en udfordrende opgave at estimere antallet, så finder de måske de to formler, jeg tidligere har anvist. Formel 1, som kun benytter antal skudte måger med ringmærke, X, og øvre grænse, M = 105, giver 114 og X = 11, hvis forudsætningen om at de konkluderer at X er ca. 10% af totaltallet, T, skal holde. Bruger de formel 2, som kun benytter nedre grænse, N = 7, og øvre grænse samt X, får de på samme måde X =12, og T = 115. Med disse forudsætninger må det korrekte svar på opgaven altså være: X er enten 11 eller 12. Men hvis vi går et skridt videre og antager at en af jægerne graver dybere og undersøger sagen vha. Monte Carlo metoder, så vil de opdage at tallene ikke passer sammen, forstået på den måde at de ikke kan opfattes som repræsentative på samme måde, som de ville være, hvis de var opstået som gennemsnitstal for et meget stort antal nedskydninger. De spekulerer så videre over, hvordan de kan overkomme denne skævhed i tallene. En god plan ville være at modificere dem på en sådan måde at formel 1 og 2 giver samme resultat. Og vel at mærke gøre det sådan at angivelserne af nedre og øvre grænse tillægges lige stor vægt. Det ene kan jo være lige så rigtigt som det andet. Jeg har prøvet at forfølge denne tanke. Jeg sætter de to formeludtryk lig hinanden og indsætter en korrektionsstørrelse D, som adderes M og fratrækkes N. (hvis D adderes til begge tal ændres M-N ikke og formel 2 bliver enerådende). Jeg får: (105 + D)(1 + 1/11) = (105 – 7 + 2D)(1 + 2/10), som giver D = - 2,3 og T = 111,04 og X/T = 0,0982. Altså: med en mere avanceret brug af formlerne, hvor alle oplysninger benyttes, er vi tilbage til X = 11. (hvis der tages udgangspunkt i X = 12 fås X/T = 0,108, så den går jo ikke). (jeg har kigget på den mulighed, at nummerrækken starter med 0. Det er jo en meget plausibel mulighed. Det giver en nemmere opdeling af fuglene i 0-erne, 1-erne osv. ligesom vi opdeler årstal. Det giver lidt andre tal, men ændrer ikke spor ved konklusionerne ovenfor.) Min overordnede konklusion er nu: X = 11. Kun i det specielle tilfælde, hvor en af jægerne lægger sig fast på udelukkende at bruge formel 2, og har held til at komme igennem med det, kan det antages af X = 12.

  • 0
  • 0

Hej Ebbe,

En af jægerne er historisk interesseret (er kendt for det i jagtforeningen - den oplysning fik vi ikke i den oprindelige opgave, men det er sådan det er!) og har læst en del bøger om WWII, bl.a. om hvordan englænderne lurede tyskerne (virker iøvrigt mærkeligt at tyskerne ikke 'krypterede' nummereringen) og med de informationer, Min og Max, jægerne har, er alle hurtigt enige om at sætte de to tal ind i 'formel 2', 12 skudte måger. Dette helt uden at jægerne skal tage stilling til / gætte på et Start nummer, som er forudsætning for at bruge 'rå symmetri'. I 'formel 1' er start nummeret givet (1), men formlen løser ikke den opgave jægerne står overfor.

;-)

PS. Er i øvrigt enig med dig i at X og T skal være heltal. Hvad med D?

  • 0
  • 0

PPS. Tak for din lange udredning, Ebbe, som jeg lige vender tilbage til.

Jeg er enig med dig i at data grundlaget er smalt - én dags ene jagt - bredere grundlag ville kræve nye / genoplivede måger med mærkning som de nedskudte, det vi har er #7 og #105 (som iøvrigt ligeså godt kunne være 'gennemsnit' af mange jagter). Der kan kun opstå overbestemthed i tallene hvis man indfører ekstra værdier, skævhed opstår når disse ikke er 'på linje' med de øvrige. De opgivne oplysninger er basseret på et smalt grundlag, men der er ikke skævhed i dem.

Med din idé om at begge formler skal give samme løsning indfører du unødigt skævhed for derefter at rette skævheden op ved at kompensere - ændre de opgivne oplysninger. Hvorfor er de nye værdier statistisk 'bedre' end de oprindelige ? Resultatet ligner en serie på 1 til 111 som ved 'rå' symmetri.

Jeg synes i stedet man skal vælge den formel der passer til opgaven - nu der er flere muligheder i TGTP værktøjskassen - og som MC bekræfter.

Jeg tror i øvrigt at vores jæger venner har undervurderet deres evner med 3-4% point. /

  • 0
  • 0

Jeg mener, at vi skal opfatte denne mågeopgave som en matematikopgave uden hensyn til jægere og dermed benytte præcis de opgivne data uden at indføre unødvendige tilføjelser. Den første tyske formel må udelukkes, da den arbitrært forudsætter at nummereringen begynder med 1. Den anden tyske formel er OK, da den ikke har denne forudsætning. Hvis der er skudt ca. 10% af mågerne, bliver det bedste resultat af denne formel, at 12 ud af 116 måger er skudt. Med oplysning om kun 2 mågers numre kan vi ikke andet end regne med symmetri, hvorved summen af første og sidste nummer skal være 7 + 105 = 112, altså en nummerering startende med -2 og dermed numre fra -2 til og med 113. Dette er den rå brug af opgavens data og i øvrigt også præcis det, der findes ved Monte Carlo-metoden.

Løsningen benytter ikke den unyttige oplysning om at1/6 af mågerne er ringmærkede sådan som opgavestillerens løsning underligt nok gør. Og opgavestilleren benytter ikke den vigtige oplysning, at 7 og 105 er yderværdierne af 12 tilfældige udfald. jeg er målløs over at blive præsenteret for så slap en "løsning".

  • 0
  • 1

I en kommentar til Erling indfører Ebbe en addend D. Men når man indfører D i formel 1, giver formlen ikke mere værdien af T. Det gør den kun når værdien 105 indsættes uden D Tilsvarende giver formel 2 ikke mere T fordi formlen er tilføjet addenden 2D. Der regnes således på en helt anden opgave og resultatet bliver upålideligt. Derimod er min beregning ovenfor skudsikker og stemmer overens med MC. Mere kan man ikke forlange. Hvis man tvivler på den, er man nødt til at påvise en fejl i den.

  • 0
  • 0

Hvis de 2 tidligere omtalte formler kan kombineres hvis man justerer startnummeret i formel 1 fra et 1-tal til et (næsten) vilkårligt tal s, sa man har [latex] \qquad (1) \qquad T_1 = (106 - s) \left( 1 + \frac{1}{x} \right) - 1 [/latex] [latex] \qquad (2) \qquad T_2 = 98 \cdot \left( 1 + \frac{2}{x - 1} \right) [/latex] \quad 116.0 \quad115.8 [/latex]

  • 0
  • 0

De 2 tidligere omtalte german tanks-formler kan kombineres hvis formel 1 justeres således at talrækken kan begynde med et vilkårligt tal s i stedet for at være bundet til et 1-tal [latex] \qquad (1) \qquad \qquad T_1 = (106 - s) \left( 1 + \frac{1}{x} \right) -1 [/latex] [latex] \qquad (2) \qquad \qquad T_2 = 98 \cdot \left( 1 + \frac{2}{x - 1} \right) [/latex] Med x = 12 får vi følgende tabel: [latex] \qquad s \qquad T_1 \qquad T_2 [/latex] [latex] \quad \, -2 \quad 116.0 \quad 115.8 [/latex] [latex] \quad \, -1 \quad 114.9 \quad 115.8 [/latex] [latex] \qquad 0 \quad 113.8 \quad 115.8 [/latex] [latex] \qquad 1 \quad 112.7 \quad 115.8 [/latex] Man ser hvorledes antallet T stemmer overens i de 2 formler hvis startnummeret er - 2 og antallet 116. Sådan er det nok ikke i praksis, men dette er jo en matematikopgave.

  • 0
  • 0

Hej Børge, 12 måger er vi enige om, men jeg er lidt usikker på nummer rækken: -2 til 113 giver 116, men ikke 112 (111) er det rigtigt forstået ?

Formel 2 giver 116 (11,6) ved 10,0%. Afrundes til 12, fås en flok på 115, de 12 måger udgør 10,4%. Afrundes til 11, fås en flok på 117, de 11 måger udgør 9,4%. 12 ligger nærmest 10% (0,4% mod 0,6% ved 11) medfører 12 skudt ud af 115. Dette giver en flok fra -1 til 113 hvor både symmetri, antal og MC passer./

  • 0
  • 0

Hej Erling

Dit første svar er rigtigt forstået. Men jeg får 116 ud fra formel 2 når x = 12 indsættes. Jeg ved ikke hvorfor du kun får 115.

Mvh Børge

  • 0
  • 0

Erling har været så venlig at g're mig opmærksom på, at formel 2 skal slutte med -1 lige som formel 1. Med denne ændring fås bedst overensstemmelswe mellem de 2 formler ved s = -1 og x = 12, nemlig T1 = 114,9 og T2 = 114,8, altså T = 115..

  • 0
  • 0

Børge, Hvis du ændre max i T1 skal du også ændre (max - min) i T2. En serie fra 1 til 111 tilfredsstiller begge (7 og 105 fastholdes). 13,51% (ca.10% + 3 til 4% point) giver 15 skudte måger - bemærk at 105/7=15. Pæne tal uden afrunding, kun bliver ca.10% blev til 13-14%. Der kan kombineres på mange måder. /mvh

  • 0
  • 0

Hej Erling. Formel 1 gælder i sin oprindelige form kun hvis nummereringen begynder med tallet 1. Da vore data ikke kan tvinges ned i den ramme, har jeg givet formlenen teoretisk korrekt udvidelse, så nummereringen kan begynde med en vilkårlig værdi s. Sætter du s = 1 er vi tilbage i den gamle formel. Jeg kan ikke gennemskue din tanke med at regne på tilfælde hvor der er stor afvigelse fra 10%, men inden du eventuelt svarer, så se mit indlæg, som jeg skriver bagefter, hvor tingene behandles enkelt og på en ny måde. Jeg siger dig tak for samspillet med denne og de foregående opgaver og ønsker dig en glædelig jul. Hvis du trænger til adspredelse i juleferien, så har jeg samlet over 100 interessante opgaver af forskellig slags, som jeg kan sende dig sammen med løsningerne. Min mail er howald@mail123.dk. Når du skriver igen, må du meget gerne fortælle hvordan man oploader en figur til Bagsiden. Det kan jeg ikke se nogen forklaring på i bladet. Mvh Børge

  • 0
  • 0

Den første af de to tyske formler gælder når nummereringen begynder med 1. Da opgavens givne data ikke rigtigt kan presses ned i den ramme, har jeg foretaget en teoretisk korrekt udvidelse af formlen, så den gælder for et (næsten) vilkårligt startnummer s. [latex] \qquad \qquad T_1 = (106 - s) \left( 1 + \frac{1}{x} \right) -1 [/latex] [latex] \qquad \qquad T_2 = 98 \cdot \left( 1 + \frac{2}{x-1} \right) -1 [/latex] Det ærgrer mig grænseløst, at jeg ikke straks fik den tanke at indsætte den givne 10% oplysning T = 10x i formlerne. Formel 2 giver så [latex] \qquad \qquad 10 x = 98 \cdot \left( 1 + \frac{2}{x-1} \right) -1 [/latex] Dette er en 2. grads ligning med løsningen x = 11,62. Vi afrunder til x = 12 og T = 116. Da kun formel 2 er benyttet, gælder resultatet uafhængigt af, hvor nummereringen begynder, men indsættelse i formel 1 giver s = -2 helt præcist. Hermed har vi opfyldt opgavetekstens krav uden at gøre andre forudsætninger. Opgavetekstens ca 10% bliver 12/116 = 10,34%. Så er den ged vist rundbarberet.

  • 0
  • 1
Bidrag med din viden – log ind og deltag i debatten