Tænkeboks: Sandsynligheden for fejl ved positiv test?

Illustration: MI grafik

I denne uge kommer opgaven igen fra SDU, Mads Clausen Instituttet i Sønderborg, og her skal kvalitetsingeniøren i arbejde:

Opgave 5: I en produktionsvirksomhed udtages med jævne mellemrum et eksemplar af et produkt, der sendes til en automatiseret test for fejl.

Erfaringsmæssigt vides, at 1 ud af 1000 produkter er defekt. Den automatiserede test er (naturligvis) ikke helt fejlfri selv, idet den vil vise en falsk positiv i 2% af tilfældene og en falsk negativ i 4% af tilfældene.

Hvad er sandsynligheden for, at et produkt er defekt, når den automatiserede test er positiv?

– – –

Vi bringer løsningen i næste uge, men fra søndag eftermiddag ligger opgaven også på adressen ing.dk/ fokus/taenkeboksen, hvor I kan poste jeres forslag til løsninger i debattråden.

/ Lynch

Illustration: MI Grafik
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Omend man kan undre sig over formålet med en så ringe test

  • 0
  • 0

Af 50000 stk. produceret vil: 50 være sande negative af de 50 vil 1 blive testet falsk positiv

Yderligere 2000 vil være falske negative. (de 4%) Men den oplysning har som sådan ikke noget med opgave at gøre.

  • 0
  • 1

Vi benytter loven om betingede sandsynligheder på situationen hvor et tilfældigt produkt testes. Lad F, D være begivenhederne at produktet er henholdsvis fungerende og defekt. Lad yderligere TP og TN være begivenhederne, at testen viser positiv eller negativ, henholdsvis. Da er P(D | TP) = P(D og TP)/P(TP)=P(D og TP)/(P(TP og D) + P(TP og F)) = 1/(1+P(TP og F)/P(TP og D)). Vi har P(TP og F) = (999/1000)(96/100) P(TP og D) = (1/1000)(2/100) således at P(TP og F)/P(TP og D) = 999*48=49592. Dermed er svaret 1/49593.

  • 0
  • 1

Prøv at lave et overslag. Af 1000 emner vil ca. 20 melde positiv i testen, og én være defekt -- så svaret skal være ca. 5%

  • 1
  • 0

Nej, hør nu! 2% af 1000 er 20, som er antallet af falske positiver. En (anden) ud af de tusind er en 'rigtig' positiv. I alt 21 'positiv-visninger'. Så sandsynligheden for at en enhed er defekt når der vises 'positiv', er 1 ud af 21, altså 4,76 %

  • 0
  • 1

Kim Bygum har ret.

Her en hurtig pædagogisk forklaring.

Hvis vi sender 100000 igennem testprocessen vil 100 være defekte. Her vil 96 af de defekte give et positivt testresultat og 4 vil give falsk negativ. Af de resterende 99900 som ikke er defekte vil 2 procent altså 1998 give falsk positiv og resten 97902 give negativ.

Det samlede antal positive bliver 96+1998=2094

Og procentdelen af de positive testresultater, der rent faktisk er defekte bliver 96/2094 * 100% = 4,58 %

  • 1
  • 0

Hvis man læser overskriften sammen med spørgsmålet, får man dog mere fornemmelsen af, at et positivt testresultat ikke betyder defekt men at dimsen virker. Hvis det er den korrekte forståelse af spørgsmålet bliver resultatet i stedet:

0,21 %.

  • 1
  • 1

Først er der upræcist sprog, hvad betyder positiv / negativ? Jeg kan ikke rigtig bestemme mig for om denne kendte fejlrate betyder noget. I princippet er der jo kun to muligheder af testen, fejl eller ej (positiv eller negativ) Hvis positiv betyder at testen fandt fejl, så får jeg omkring 98% sikkert at emnet fejlede. Jeg ved ikke hvordan de 4% falske negative skal indkorporeres, for de vil jo øge sandsynligheden for at man får et positivt resultat, selvom det skyldes testen og ikke emnet. Måske betyder det at man kun med 97% sikkerhed kan sige at emnet reelt set fejlede. Og det var hvad der blev spurgt om.

  • 0
  • 1

Jeg må indrømme, at det er et meget forvirrende spørgsmål, og jeg måske har regnet forkert. Jeg tog et positivt resultat som værende, at dimsen virker. Det man oftest vil være interesseret i i sådanne tilfælde er vel, hvad sandsynligheden for, at man sender et fejlbarligt produkt ud (som man tror virker), er?

  • 0
  • 0

Det man oftest vil være interesseret i i sådanne tilfælde er vel, hvad sandsynligheden for, at man sender et fejlbarligt produkt ud (som man tror virker), er?

Det er ikke opgavens spørgsmål. "Hvad er sandsynligheden for, at et produkt er defekt, når den automatiserede test er positiv?" Jeg læser det som ene og alene handlende om det ene produkt/sample der testes. Noget andet interessant er, om denne test (med sine fejl) kan underbygge at fejlraten i produktionen skulle være en af tusind. Det kan blive lidt cirkulært at benytte den gættede fejlrate i produktionen til at beregne fejlraten i produktionen ud fra testen.

  • 0
  • 0

Der står faktisk, at der testes for om dimsen er defekt: "...der sendes til en automatiseret test for fejl." Hvis man tester for fejl, så betyder positiv defekt, selvom oplevelsen af en defekt er det modsatte...

  • 0
  • 0

Nu er der ikke meget realisme i denne opgave. Sandsynligheden for at den udtagne prøve positiv er 2,09%, så testen siger intet om kvaliteten i produktionen men en masse om kvaliteten af testen

  • 0
  • 0

[slettet for nærmere (gen)overvejelse! :)]

- prøver nok engang:

Egen forudsætning: Jeg definerer, at ‘test positiv’ er ensbetydende med ‘kassabel’!

Given forudsætning 1 promille af populationen antages (in casu = forudsættes) at være kassable.

Forsøg på lavpraktisk (‘middelværdibaseret’) tilgang:

Udtager vi en stikprøve på fx. 100.000, vil 100 være kassable (NB! ‘I middel’! - det faktisk forventelige antal kan bestemmes vha. Newtons binomialformel).

Af de 99.900 ‘gode’ vil 2% blive (fejl)bedømt ‘kassabel’, svarende til 1998.

(Af de 100 kassable vil 4% blive (fejl)bedømt ‘godkendt’, svarende til 4 - hvilket dog synes uden (væsentlig) betydning her).

I stikprøven befinder sig 100 kassable enheder, mens 1998 (fejlagtigt) ‘stigmatises’ som værende kassable.

De øvrige testforløb: 100.000 - 1998 (-4) = 98002 (97998) er ‘retvisende’.

Svaret på spørgsmålet “Hvad er sandsynligheden for, at et produkt er defekt, når den automatiserede test er positiv?” bliver således (med ganske god tilnærmelse!(?)) ensbetydende med sandsynligheden for ‘retvisende testforløb’ = (ca.) 98000/100000 = 98%

  • 0
  • 1

Helt enig med den første besvarelse (Kim Bygum). Bayes teorem giver mulighed for at invertere den betingede sandsynlighed og dermed er sandsynligheden for at produktet er defekt givet at testen viser defekt 4.58%. Der er dog lidt sproglig tvivl om definitionerne. I det modsatte tilfælde hvor "falsk negativ" betyder at testen viser defekt produkt selvom det er i orden, giver Bayes lov en sandsynlighed på 2.4% for at produktet er defekt når testen indikerer defekt.

  • 0
  • 0

dermed er sandsynligheden for at produktet er defekt givet at testen viser defekt 4.58%.

Den test er vist overflødig, når kun 4,58% af de positive (fejlede) emner reelt er fejlede.

Det er åbenbart svært at skrive sådan en simpel tekst der sikrer at den bliver læst på samme måde, for de vidt forskellige resultater kan ikke være regnefjl, men forskellig forståelse. Hvis det overføres til en kravspecifikation på flere tusind sider, så forstår jeg godt problemerne.

  • 2
  • 1

Jeg er absolut uenig. Det er en ganske simpel opgave, som er klart og tydeligt beskrevet. Men der nok mange, som læser dét de vil læse i stedet for dét der står

  • 0
  • 0

Det er en ganske simpel opgave, som er klart og tydeligt beskrevet.

Hej Kim. Nej det er den ikke. Negativ og positiv test er uklar. Det er almindeligt i virksomheder og brancher, at man bruger ord der er entydige i virksomheden/branchen, men som udenfor kan opfattes helt anderledes. Man er vænnet til det og tænker ikke et øjeblik på at folk udenfor området kan forstå noget andet ved ordene. Skal man skrive til folk udenfor branchen bør man virkelig tænke sig om og overveje om virksomhedsjargonen måske kan opfattes anderledes end man er vant til. Det er slet ikke så let som det lyder. Disse 4,5% tyder på at positiv betyder at emnet er OK i testen. Hvis du decideret tester for fejl, opfatter jeg en positiv test som at du har fundet en fejl. Hvorfor skal defekt/ikke defekt pludselig erstattes af positiv/negativ uden anden forklaring? Det er jargon når det bliver værst. Der er ingen grund til denne omformulering. Normalt hvis din læge tager en prøve og den er positiv, så betyder det at noget er galt.

Jeg er spændt på om den officielle løsning omformulere teksten, som det skete med fængslet.

  • 2
  • 0

Prøv at lave et overslag. Af 1000 emner vil ca. 20 melde positiv i testen, og én være defekt -- så svaret skal være ca. 5%

At læse: Der blev kun spurgt om sikkerheden for at et emne der var defekt i testen også virkelig var defekt, hvis positiv betyder defekt. Nok er det en teoretisk opgave, men at 95% af de fejlede emner i testen alligevel var OK er lige til en fyring. Hvor mange emner ville kunne betegnes OK selvom de reelt var defekte?

  • 0
  • 0

Hvorfor skal defekt/ikke defekt pludselig erstattes af positiv/negativ uden anden forklaring

Fordi det ikke er det samme! Testen er positiv eller negativ (i henhold til helt gængs sprogbrug), produktet kan være defekt.

Selv om man nogle gange kan blive i tvivl, skal man huske at det her er en teknisk side. Og hvis han har en lille smule kendskab til produktion og et basalt kendskab til sandsynlighedsregning er det (efter min mening) en velformuleret og (for) nem opgave (urealistisk, ja, men det er nok for at give den det twist som gør den speciel)

  • 0
  • 0

Som ikke særligt teknisk læser, vil jeg sige at opgaven var fint og utvetydigt formuleret. Hvis man tester for at finde defekter er et positivt resultat at man har fundet en fejl. Det lærte hele Danmarks befolkning med udtrykket "HIV positiv".

Det er flere, som nævner at de mange falsk-positive er et problem. Jeg tænker at i en produktion er de falsk-negative et langt større problem. Derimod er det i sundsvæsenet et stort problem med en høj rate af falsk-positiv. Forestil jer at en positiv (falsk eller ej) udløser behandling for 100000 kr. Der er 1/10000 risiko for at en borger har sygdommen og 1% der testes falsk positiv. Hvis vi tester en million borgere, hvor mange penge kan vi så spare ved at fordoble testens præcision?

  • 1
  • 0
Bidrag med din viden – log ind og deltag i debatten