blogs kategori-billede

Benfords Lov og græsk økonomi

Af Klaus Seiersen,  tirsdag 20. sep 2011 kl. 10:51

Jeg faldt i går over dette blogindlæg fra engelske Ben Goldacre, og det lærte mig noget nyt om både matematik og økonomi.

Goldacre fortæller om Benfords Lov, der er en matematisk funktion, der beskriver fordelingen af det første ciffer i forskellige dagligdags talmængder (med det første ciffer menes f.eks. 1 i tallet 1234). Tallet 1 forekommer oftere end tallet 2, som forekommer oftere end 3, og så videre.

Det er ikke en eksakt lov, men den gælder som ret god tilnærmelse til forskellige data som f.eks. befolkningstal i lande eller byer, antal bøger på amerikanske biblioteker, højden i meter på verdens højeste bygninger, samt antal "followers" alle brugere har på Twitter.

Benfords Lov er dog ikke bare en matematisk pudsighed, idet den kan anvendes til at teste, om nogen har fusket med f.eks. økonomiske og samfundsmæssige nøgletal, hvilket blev foreslået af økonomen Hal Varian i 1972. Teorien er, at hvis nogen forsøger at ændre på data ved at indsætte fabrikerede tal, så vil dataene afvige markant fra Benfords Lov. Blandt har Benfords Lov antydet, at valgresultatet fra det iranske valg i 2009 var manipuleret.

Goldacres blogindlæg er motiveret af en ny artikel i tidsskriftet German Economic Review. Her har forfatterne vurderet de økonomiske tal fra alle EUs lande, og konklusionen er, at det land, hvis tal afviger mest fra Benfords Lov, er... Grækenland!



20. sep 2011 kl 16:41

avatar

Aage Andersen

Let at omgaa.

Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?


20. sep 2011 kl 16:47

avatar

Poul-Henning Kamp


21. sep 2011 kl 14:55

Morten Jensen

Re: Let at omgaa.

Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?

Hvis du ganger alle tal med en fælles faktor, så ændrer du vel ikke på forholdene mellem tallene. Hvis du f.eks. ganger import og eksport med 1.2, så parallelforskyder du kun balancen, du ændrer den ikke. Hvis man vil fuske med sit regnskab, så vil man nok gøre det på en måde der forskyder balancen i regnskabet til egen fordel - og så går det vel ikke, bare at gange en faktor på alle tal.


21. sep 2011 kl 16:59

avatar

Aage Andersen

Re: Let at omgaa.

Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?

Hvis du ganger alle tal med en fælles faktor, så ændrer du vel ikke på forholdene mellem tallene. Hvis du f.eks. ganger import og eksport med 1.2, så parallelforskyder du kun balancen, du ændrer den ikke. Hvis man vil fuske med sit regnskab, så vil man nok gøre det på en måde der forskyder balancen i regnskabet til egen fordel - og så går det vel ikke, bare at gange en faktor på alle tal.

Jeg vil gange eksporten med 1.2 og dividere importen med 1.2


21. sep 2011 kl 17:04

avatar

Jon Bendtsen

Re: Let at omgaa.

Jeg vil gange eksporten med 1.2 og dividere importen med 1.2

Hvorfor gøre det så besværligt at gange noget på et reelt tal når man bare kan opfinde sine egne tal?


21. sep 2011 kl 18:14

Morten Jensen

Re: Let at omgaa.

@Aage Andersen

Jeg vil gange eksporten med 1.2 og dividere importen med 1.2

Okay, men så er det vel heller ikke en fælles faktor du multiplicerer med?

Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?

Du vil gange og dividere med den samme faktor, dvs. gange med faktor k og 1/k. Hvis du gør det sådan, så tror jeg da du ændrer på leading-digit distributionen og så kan du lige så godt gøre som Jon foreslår:

@Jon Bendtsen
Hvorfor gøre det så besværligt at gange noget på et reelt tal når man bare kan opfinde sine egne tal?


21. sep 2011 kl 19:40

avatar

Aage Andersen

Re: Let at omgaa.

@Aage Andersen

Jeg vil gange eksporten med 1.2 og dividere importen med 1.2


Okay, men så er det vel heller ikke en fælles faktor du multiplicerer med?

Jeg gav bare et simpelt eksempel.


Hvis man er opmærksom paa Benfords lov, naar man manipulerer med data, maa den være let at omgaa. F. eks. vil en multiplikation af alle tal med en fælles faktor vel ikke ændre paa fordelingen af cifre?

Du vil gange og dividere med den samme faktor, dvs. gange med faktor k og 1/k. Hvis du gør det sådan, så tror jeg da du ændrer på leading-digit distributionen og så kan du lige så godt gøre som Jon foreslår:


Nej. Ved at benytte forskellige faktorer ved de forskellige talsæt, ændrer man ikke paa cifrenes fordelig. Der er mange sofistikerede muligheder til at manipulere paa data saa de fremstaar mere fordelagtigt uden at bryde Bendfords lov. Det er dette jeg vil gøre opmærksom paa. Jeg er sikker paa at dem der vil manipulere ogsaa kan finde disse metoder.


21. sep 2011 kl 20:22

avatar

Poul-Henning Kamp

Re: Let at omgaa.


Der er mange sofistikerede muligheder til at manipulere paa data saa de fremstaar mere fordelagtigt uden at bryde Bendfords lov.

Mnjae, det er faktisk sværere end man lige skulle tro.

De fleste manipulationer forsøger at forandre et forhold, parti A vs parti B eller løn vs investering osv, men er nødt til at holde summen den samme fordi den er nem at kontrollere.


21. sep 2011 kl 22:27

Bjarke Mønnike

Jeg spekulerede på....

.....om dette fænomen også kan bruges på klimadata ?

Eller er det kun muligt at anvende på samfundsmæssige og økonomiske forhold fordi vejrligs og klima værdier ligner random givne tal.

Det er en morsom øvelse at prøve selv :o)


21. sep 2011 kl 22:33

avatar

Poul-Henning Kamp

Re: Jeg spekulerede på....

.....om dette fænomen også kan bruges på klimadata ?

Læs det link jeg gav ovenfor og tænk selv ?


21. sep 2011 kl 23:21

Jørgen Nilsson

Professor Stewart's cabinet of mathemati

Endelig fandt jeg bogen, hvori jeg havde læst om Benfords lov. Herfra et lille uddrag, som er relevant:

Benford's formula is distinguished by a beautiful property: is is scale-invariant. If you measure the areas of Bahamian islands in square miles or square kilometres, if you multiply house numbers by 7 or 93, then - provided you have a big enough sample - the same law applies. In fact Benford's formula is the ONLY scale-invariant frequency law. It is unclear why nature prefers scale-invariant frequencies, but it seems reasonable that the natural world should not be affected by the units in which humans choose to measure it.

For øvrigt en god lokums-bog, som kan anbefales.


22. sep 2011 kl 02:27

Morten Jensen

Re: Let at omgaa.

Nej. Ved at benytte forskellige faktorer ved de forskellige talsæt, ændrer man ikke paa cifrenes fordelig.

Øh, hvis du tager et talsæt og ganger hvert ciffer med noget forskelligt, så ændrer du da deres fordeling? Jeg kan vælge en faktor til hvert tal, så de allesammen giver et tal der starter med f.eks. 5.

Der er mange sofistikerede muligheder til at manipulere paa data saa de fremstaar mere fordelagtigt uden at bryde Bendfords lov. Det er dette jeg vil gøre opmærksom paa. Jeg er sikker paa at dem der vil manipulere ogsaa kan finde disse metoder.

Ja der skal nok findes en række faktorer man kan gange på der giver en plausibel benford fordeling, men igen - hvorfor så ikke bare opfinde tallene istedet for at gange faktorer på?


22. sep 2011 kl 11:01

avatar

Aage Andersen

Re: Let at omgaa.


Øh, hvis du tager et talsæt og ganger hvert ciffer med noget forskelligt, så ændrer du da deres fordeling? Jeg kan vælge en faktor til hvert tal, så de allesammen giver et tal der starter med f.eks. 5.

Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.


22. sep 2011 kl 13:08

Bjørn Sune Andersen

Re: Let at omgaa.

Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.
Benfords lov handler om fordelingen af det mest betydende ciffer i et sæt. Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?


Bjørn


22. sep 2011 kl 13:28

Kim Bygum

Re: Let at omgaa.

Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.

Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.
Benfords lov handler om fordelingen af det mest betydende ciffer i et sæt. Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?

Det er jo netop det fascinerende ... selv om du ændrer det første ciffer ved denne operation bevares fordelingen.


22. sep 2011 kl 13:31

Kai Birger Nielsen

Re: Let at omgaa.

Hvis du tager en logaritmisk skala fra 1 til 10, skalerer alle tal i testsæt så de havner i intervallet og plotter de skalerede data på den logaritmiske skala, så vil du få en ligelig fordeling, hvis de følger Benfords lov.
At gange hele sættet med en bestemt faktor, svarer til at parallelforskyde datasættet med log(faktoren), dvs du har stadig en ligelig fordeling og det opgangede datasæt følger stadig Benfords lov.


22. sep 2011 kl 13:40

Peter Stig Hansen

Re: Let at omgaa.

Hvordan vil du gange alle tal i sættet med en faktor og stadigvæk opfylde Benfords lov - hint: Hvad sker der med det mest betydende ciffer?

Læs linket fra PHK længere oppe i tråden! Benfords lov er, som Aage siger, "scale invariant" (aner ikke hvad det skal oversættes til på dansk) og endog også "base invariant"


22. sep 2011 kl 13:45

Bjørn Sune Andersen

Re: Let at omgaa.

Det er jo netop det fascinerende ... selv om du ændrer det første ciffer ved denne operation bevares fordelingen.
Host - Benfords lov siger netop noget om antallet af et-taller som mest betydende ciffer i forhold til to-taller som mest betydende ciffer og så videre opad.

Forestil dig at du ganger hvert tal i sættet med 2, hvad sker der så med alle de mest betydende et-taller i sættet? De skifter værdi - og dermed passer de ikke længere til Benfords lov.


Bjørn


22. sep 2011 kl 14:00

Morten Jensen

Re: Let at omgaa.

@Aage Andersen

Det misforstaar du. Hvis du har et talsæt, der opfylder benfords lov og du multiplicerer hvert tal med den SAMME faktor faar du et talsæt, der ogsaa opfylder bendfords lov. Det kaldes "scale invariance" paa udenlandsk.
Hvis man multiplicerer hvert enkelt eksporttal med samme faktor, faar man stadig en række af "eksporttal" Gør man det ogsaa ved importtallene men med en anden faktor, er det lykkedes at "pynte" paa balancen og det kan ikke afsløres med at prøve for bendfords lov.

Jeg tror vi er enige. Det eneste jeg anfægtede, var:

Nej. Ved at benytte forskellige faktorer ved de forskellige talsæt, ændrer man ikke paa cifrenes fordelig

Jeg kom med et modeksempel, hvor man (ved at vælge faktorerne omhyggeligt) kunne få alle tal til at give 5, og derved smadre distributionen. Jeg tror jeg misforstod din mening med det citerede tekst.

Derudover, tror jeg såmænd vi er enige :)


@Bjørn Sune Andersen
Forestil dig at du ganger hvert tal i sættet med 2, hvad sker der så med alle de mest betydende et-taller i sættet? De skifter værdi - og dermed passer de ikke længere til Benfords lov.

Ja, og hvad sker der med alle de mest betydende 5-taller? De bliver til ettere. Mange andre tal får også et ét-tal som mest betydende osv. Eksempler:
2 * 6000 = 12000
2 * 0.78 = 1.56 etc

Du skubber jo hele talrækken med den faktor du vælger.
Hvis tallene inden faktoreringen passer på benford fordelingen, så gør de også bagefter.
Læs evt. PHK's link til DSPguide bogen - der er et godt eksempel.


22. sep 2011 kl 14:11

Bjørn Sune Andersen

Re: Let at omgaa.

Ja, og hvad sker der med alle de mest betydende 5-taller? De bliver til ettere. Mange andre tal får også et ét-tal som mest betydende osv. Eksempler:
2 * 6000 = 12000
2 * 0.78 = 1.56 etc
Benfords lov dikterer et forhold imellem de betydende cifre - der skal være flere 1-taller end 2-taller osv.
Her gør du så (groft sagt) alle 1-taller til 5-taller og alle 5-taller til 1-taller - hvad er så forholdet imellem 1-taller og 5-taller efter multiplikationen?

Du skubber jo hele talrækken med den faktor du vælger.
Hvis tallene inden faktoreringen passer på benford fordelingen, så gør de også bagefter.
Tag et meget groft eksempel: Du starter med 5 1-taller og 1 5-tal som opfylder Benfords lov - efter multiplikationen har du så 1 1-tal og 5 5-taller, det opfylder ikke Benfords lov.


Bjørn


22. sep 2011 kl 14:51

Peter Stig Hansen

Re: Let at omgaa.

Igen Bjørn, læs PHK's link!


22. sep 2011 kl 15:02

Morten Jensen

Re: Let at omgaa.

Tag et meget groft eksempel: Du starter med 5 1-taller og 1 5-tal som opfylder Benfords lov - efter multiplikationen har du så 1 1-tal og 5 5-taller, det opfylder ikke Benfords lov.

Fem 1-taller og et 5-tal opfylder ikke benfords lov, derfor er dit eksempel ikke godt. Hvis tallene opfylder benfords lov, skal de fordeles således:

http://www.dspguide.com/graphi....gif (graf a)

Hvis du tog et eksempel der opfyldte benfords lov, og gangede igennem med den samme faktor, ville du se at benfords lov opfyldes. Som Peter siger, læs linket og læs især om "ones scaling test", som netop omhandler det vi taler om her.

http://www.dspguide.com/ch34/3....htm


22. sep 2011 kl 16:13

Ulf Larsen

Benford's lov som unreality-check

Mht. artiklens pointe, nemlig noget ikke-Benford ved nogle suspekte data:

Hvis vi antager at denne type data, når de er ægte, følger Benford's lov, så må det vel gælde såvel data fra gode tider, som data fra dårlige. Hvorfor så ikke simpelthen "opfinde" nogle data der svarer til gode tider, selvom de ægte er dårlige?

Altså, hvis Benford's lov er semi-universel, så kan den ikke anvendes som reality-check. Men muligvis godt som unreality-check.


22. sep 2011 kl 16:54

avatar

Aage Andersen

Re: Jeg spekulerede på....

.....om dette fænomen også kan bruges på klimadata ?



Eller er det kun muligt at anvende på samfundsmæssige og økonomiske forhold fordi vejrligs og klima værdier ligner random givne tal.



Det er en morsom øvelse at prøve selv :o)

Benfords lov gælder kun for data der er jævnt spredt over flere dekader.
Det er klimadata som temperatur og tryk ikke.


22. sep 2011 kl 17:29

Morten Jensen

Re: Jeg spekulerede på....

Benfords lov gælder kun for data der er jævnt spredt over flere dekader.

Kan jeg bede dig uddybe det udsagn?


22. sep 2011 kl 17:55

avatar

Aage Andersen

Re: Jeg spekulerede på....

Benfords lov gælder kun for data der er jævnt spredt over flere dekader.

Kan jeg bede dig uddybe det udsagn?

http://en.wikipedia.org/wiki/B..._law


22. sep 2011 kl 17:57

Ulf Larsen

Re: Jeg spekulerede på....

Benfords lov gælder kun for data der er jævnt spredt over flere dekader.

Kan jeg bede dig uddybe det udsagn?

Det er også forklaret udmærket i PHK's link til Smith's bog.


22. sep 2011 kl 18:03

Morten Jensen

Re: Jeg spekulerede på....

Benfords lov gælder kun for data der er jævnt spredt over flere dekader.

Kan jeg bede dig uddybe det udsagn?

Det er også forklaret udmærket i PHK's link til Smith's bog.

Ah, jeg misforstod dekader, til at betyde årtier istedet for "ordener af ti"/magnitudes.


Ny i debatten? Opret en brugerkonto

  • Seneste nyt
  • Mest læste
  • Debatterede
 

Nyhedsbrev

Tilmeld dig vores nyhedsbrev.