Let at omgaa.
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
Jeg faldt i går over dette blogindlæg fra engelske Ben Goldacre, og det lærte mig noget nyt om både matematik og økonomi.
Goldacre fortæller om Benfords Lov, der er en matematisk funktion, der beskriver fordelingen af det første ciffer i forskellige dagligdags talmængder (med det første ciffer menes f.eks. 1 i tallet 1234). Tallet 1 forekommer oftere end tallet 2, som forekommer oftere end 3, og så videre.
Det er ikke en eksakt lov, men den gælder som ret god tilnærmelse til forskellige data som f.eks. befolkningstal i lande eller byer, antal bøger på amerikanske biblioteker, højden i meter på verdens højeste bygninger, samt antal "followers" alle brugere har på Twitter.
Benfords Lov er dog ikke bare en matematisk pudsighed, idet den kan anvendes til at teste, om nogen har fusket med f.eks. økonomiske og samfundsmæssige nøgletal, hvilket blev foreslået af økonomen Hal Varian i 1972. Teorien er, at hvis nogen forsøger at ændre på data ved at indsætte fabrikerede tal, så vil dataene afvige markant fra Benfords Lov. Blandt har Benfords Lov antydet, at valgresultatet fra det iranske valg i 2009 var manipuleret.
Goldacres blogindlæg er motiveret af en ny artikel i tidsskriftet German Economic Review. Her har forfatterne vurderet de økonomiske tal fra alle EUs lande, og konklusionen er, at det land, hvis tal afviger mest fra Benfords Lov, er... Grækenland!
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
21. sep 2011 kl 14:55
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
Hvis du ganger alle tal med en fælles faktor, så ændrer du vel ikke på forholdene mellem tallene. Hvis du f.eks. ganger import og eksport med 1.2, så parallelforskyder du kun balancen, du ændrer den ikke. Hvis man vil fuske med sit regnskab, så vil man nok gøre det på en måde der forskyder balancen i regnskabet til egen fordel - og så går det vel ikke, bare at gange en faktor på alle tal.
Jeg vil gange eksporten med 1.2 og dividere importen med 1.2
21. sep 2011 kl 18:14
@Aage Andersen
Jeg vil gange eksporten med 1.2 og dividere importen med 1.2
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
Hvorfor gøre det så besværligt at gange noget på et reelt tal når man bare kan opfinde sine egne tal?
@Aage Andersen
Jeg vil gange eksporten med 1.2 og dividere importen med 1.2
Okay, men så er det vel heller ikke en fælles faktor du multiplicerer med?
Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?
Du vil gange og dividere med den samme faktor, dvs. gange med faktor k og 1/k. Hvis du gør det sådan, så tror jeg da du ændrer på leading-digit distributionen og så kan du lige så godt gøre som Jon foreslår:
Der er mange sofistikerede muligheder til at manipulere paa data saa de fremstaar mere fordelagtigt uden at bryde Bendfords lov.
21. sep 2011 kl 22:27
.....om dette fænomen også kan bruges på klimadata ?
Eller er det kun muligt at anvende på samfundsmæssige og økonomiske forhold fordi vejrligs og klima værdier ligner random givne tal.
Det er en morsom øvelse at prøve selv :o)
.....om dette fænomen også kan bruges på klimadata ?
21. sep 2011 kl 23:21
Endelig fandt jeg bogen, hvori jeg havde læst om Benfords lov. Herfra et lille uddrag, som er relevant:
Benford's formula is distinguished by a beautiful property: is is scale-invariant. If you measure the areas of Bahamian islands in square miles or square kilometres, if you multiply house numbers by 7 or 93, then - provided you have a big enough sample - the same law applies. In fact Benford's formula is the ONLY scale-invariant frequency law. It is unclear why nature prefers scale-invariant frequencies, but it seems reasonable that the natural world should not be affected by the units in which humans choose to measure it.
For øvrigt en god lokums-bog, som kan anbefales.
22. sep 2011 kl 02:27
Nej. Ved at benytte forskellige faktorer ved de forskellige talsæt, ændrer man ikke paa cifrenes fordelig.
Der er mange sofistikerede muligheder til at manipulere paa data saa de fremstaar mere fordelagtigt uden at bryde Bendfords lov. Det er dette jeg vil gøre opmærksom paa. Jeg er sikker paa at dem der vil manipulere ogsaa kan finde disse metoder.
Øh, hvis du tager et talsæt og ganger hvert ciffer med noget forskelligt, så ændrer du da deres fordeling? Jeg kan vælge en faktor til hvert tal, så de allesammen giver et tal der starter med f.eks. 5.
22. sep 2011 kl 13:08
Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.Benfords lov handler om fordelingen af det mest betydende ciffer i et sæt. Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.
22. sep 2011 kl 13:28
Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.Benfords lov handler om fordelingen af det mest betydende ciffer i et sæt. Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.
22. sep 2011 kl 13:31
Hvis du tager en logaritmisk skala fra 1 til 10, skalerer alle tal i testsæt så de havner i intervallet og plotter de skalerede data på den logaritmiske skala, så vil du få en ligelig fordeling, hvis de følger Benfords lov.
At gange hele sættet med en bestemt faktor, svarer til at parallelforskyde datasættet med log(faktoren), dvs du har stadig en ligelig fordeling og det opgangede datasæt følger stadig Benfords lov.
22. sep 2011 kl 13:40
Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?
22. sep 2011 kl 13:45
Det er jo netop det fascinerende ... selv om du ændrer det første ciffer ved denne operation bevares fordelingen.Host - Benfords lov siger netop noget om antallet af et-taller som mest betydende ciffer i forhold til to-taller som mest betydende ciffer og så videre opad.
22. sep 2011 kl 14:00
@Aage Andersen
Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.
Nej. Ved at benytte forskellige faktorer ved de forskellige talsæt, ændrer man ikke paa cifrenes fordelig
Forestil dig at du ganger hvert tal i sættet med 2, hvad sker der så med alle de mest betydende et-taller i sættet? De skifter værdi - og dermed passer de ikke længere til Benfords lov.
22. sep 2011 kl 14:11
Ja, og hvad sker der med alle de mest betydende 5-taller? De bliver til ettere. Mange andre tal får også et ét-tal som mest betydende osv. Eksempler:Benfords lov dikterer et forhold imellem de betydende cifre - der skal være flere 1-taller end 2-taller osv.
2 * 6000 = 12000
2 * 0.78 = 1.56 etc
Du skubber jo hele talrækken med den faktor du vælger.Tag et meget groft eksempel: Du starter med 5 1-taller og 1 5-tal som opfylder Benfords lov - efter multiplikationen har du så 1 1-tal og 5 5-taller, det opfylder ikke Benfords lov.
Hvis tallene inden faktoreringen passer på benford fordelingen, så gør de også bagefter.
22. sep 2011 kl 14:51
Igen Bjørn, læs PHK's link!
22. sep 2011 kl 15:02
Tag et meget groft eksempel: Du starter med 5 1-taller og 1 5-tal som opfylder Benfords lov - efter multiplikationen har du så 1 1-tal og 5 5-taller, det opfylder ikke Benfords lov.
22. sep 2011 kl 16:13
Mht. artiklens pointe, nemlig noget ikke-Benford ved nogle suspekte data:
Hvis vi antager at denne type data, når de er ægte, følger Benford's lov, så må det vel gælde såvel data fra gode tider, som data fra dårlige. Hvorfor så ikke simpelthen "opfinde" nogle data der svarer til gode tider, selvom de ægte er dårlige?
Altså, hvis Benford's lov er semi-universel, så kan den ikke anvendes som reality-check. Men muligvis godt som unreality-check.
.....om dette fænomen også kan bruges på klimadata ?
Eller er det kun muligt at anvende på samfundsmæssige og økonomiske forhold fordi vejrligs og klima værdier ligner random givne tal.
Det er en morsom øvelse at prøve selv :o)
22. sep 2011 kl 17:29
Benfords lov gælder kun for data der er jævnt spredt over flere dekader.
Benfords lov gælder kun for data der er jævnt spredt over flere dekader.
Kan jeg bede dig uddybe det udsagn?
22. sep 2011 kl 17:57
Benfords lov gælder kun for data der er jævnt spredt over flere dekader.
Kan jeg bede dig uddybe det udsagn?
22. sep 2011 kl 18:03
Benfords lov gælder kun for data der er jævnt spredt over flere dekader.
Kan jeg bede dig uddybe det udsagn?
Det er også forklaret udmærket i PHK's link til Smith's bog.