Hvor ofte er de sidste fire cifre identiske i to personnumre?
more_vert
close

Få de daglige nyheder fra Version2 og Ingeniøren. Læs mere om nyhedsbrevene her.

close
Ved at tilmelde dig accepterer du vores Brugerbetingelser, og at Teknologiens Mediehus og IDA-gruppen lejlighedsvis kan kontakte dig om arrangementer, analyser, nyheder, tilbud mm via telefon, SMS og email. I nyhedsbreve og mails fra Teknologiens Mediehus kan findes markedsføring fra samarbejdspartnere.

Hvor ofte er de sidste fire cifre identiske i to personnumre?

Ole Kragh undrer sig over, at de sidste fire cifre i hans søns og hans eget personnummer er identiske.

"Det har altid undret mig, at de sidste fire cifre i min ældste søns og mit eget personnummer er identiske. Hvis vi udelukker en fejl ved nummertildelingen, hvor tit vil et sådant far/søn sammentræf statistisk forekomme?"

Thomas Bolander, lektor på Institut for Matematisk Modellering på DTU, svarer:

"Hvis I begge er født mellem 1937 og 1999 vil cifrene 7 til 9 ligge i et af følgende intervaller:

000-399
437-499
937-999.

Der er altså her i alt 526 mulige kombinationer af disse 3 cifre. Det 10. ciffer er et kontrolciffer, som bestemmes entydigt ud fra de foregående 9 cifre i personnummeret (en særlig vægtet tværsum af samtlige cifre skal være delelig med 11). Som bekendt skal det 10. ciffer være ulige for mænd. Da det 10. ciffer er entydigt bestemt ud fra cifrene 7 til 9, er derfor ikke alle af de 526 kombinationer af cifrene 7 til 9, som kan bruges for en given mand.

Hvor mange af de 526 kombinationer, der er mulige, afhænger naturligvis af de første 6 cifre i personnummeret. Men det kan med en vis rimelighed antages, at det i gennemsnit er halvdelen af disse 526, der er mulige, dvs. 263. Med den måde som kontrolcifferet beregnes på, kan det også antages, at der er lige stor sandsynlighed for ethvert at de 5 forskellige mulige ulige kontrolcifre - også selv når cifrene 7 til 9 er identiske. Hvis vi antager, at cifrene 7 til 9 tildeles tilfældigt i de ovenfor givne intervaller, vil sandsynligheden for en bestemt kombination af cifrene 7 til 10 for en mand altså være 5*263 i minus første. Dette er ca. 0.07 procent. Dette bliver også sandsynligheden for, at to mænd har samme kombination af de 4 cifre.

Sandsynligheden kan ikke være andet end en tilnærmelse. Hvis man ønsker et mere præcist tal, bliver man nødt til også f.eks. at tage højde for fordelingen af fødselsdage over et år (som ikke er ligelig), fordelingen af aldersforskelle mellem fædre og deres børn og meget mere.

Men tallet 0.07 procent er formodentlig en nogenlunde fornuftig tilnærmelse, selvom det præcise tal nok er lidt højere."

Spørg Scientariet er i dag redigeret af Julian Henlov, juh@ing.dk.

Emner : Matematik

Spørg fagfolket

Du kan spørge om alt inden for teknologi og naturvidenskab. Redaktionen udvælger indsendte spørgsmål og finder den bedste ekspert til at svare – eller sender spørgsmålet videre til vores kloge læsere. Klik her for at stille dit spørgsmål til fagfolket.

sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

I slutningen af tredie-sidste paragraf skal der naturligvis stå "samme kombination af de 4 cifre" i stedet for "samme kombination af de 2 cifre". Beklager fejlen.

  • 0
  • 0

Jeg synes denne beregning er forkert.

Den rigtige beregning må være:
For at det overhovedet kan lade sig gøre at de har de samme fire sidste cifre må checksum beregningen af de første 6 cifre give det samme resultat for deres to fødselsdatoer. Da checkcifferberegningen er en modulo 11 konstruktion er sandsynligheden 1/11, under antagelsen at checkciffer beregningen er ligeligt fordelt.
Der er som du skriver 526 muligheder for de næste 3 tal, heraf kan dog ca. en 1/11 ikke bruges da de ville give et checkciffer på 10, ligeledes vil ca. halvdelen af de resterende tal være til piger så ialt får vi ca 239 brugbare tal. Så hvis to mænd har samme checkberegning for deres fødelsdato vil de have 1/239 sandsynlighed for at dele de fire sidste cifre, hvis løbenummeret bliver tildelt tilfældigt. Løbenummeret bliver imidlertid ikke tildelt tilfældigt, men i rækkefølge nedefra så sandsynligheden bliver større, men lad os se bort fra det.

Hvis checksumberegningen er ens og løbenummeret er ens bliver det sidste ciffer også ens så alt i alt bliver sandsynligheden for at have identiske fire sidste cifre:
1/11 * 1/239 = 1/2629 = 0.038 %

mvh
Christian

  • 0
  • 0

Christians Paulsens tal er det rigtige og mit er forkert. Forskellen på de to tal er dog kun at Christians tal er det halve af mit. I min beregning fik jeg divideret antal mulige kombinationer med 2 en gang for meget (man kan sige jeg kom til at "dobbeltkompensere" for det faktum at mænd altid har et ulige slutciffer). Vores beregninger er tydeligvis foretaget med forskellige betragtninger, men burde give det samme. Lad mig prøve at gennemgå de to forskellige betragtninger herunder.

Først min. Jeg ser kun på de sidste 4 cifre og vil vurdere sandsynligheden for at en mand får een bestemt kombination af de 4 cifre. Antallet af mulige kombinationer af cifrene 7 til 9 er 526 og antal mulige kombinationer af sidste ciffer er 10. Det giver så i alt 52610 kombinationsmuligheder. Men heraf skal vi smide ca. halvdelen væk, da disse svarer til et lige slutciffer. I alt bliver antallet af mulige kombinationer af de 4 cifre for en given mand lig 1/(5265). Dette er så også sandsynligheden for at to mænd har samme kombination af disse 4 cifre. Bemærk at jeg i dette argument har fået rettet fejlen fra det oprindelige argument, hvor jeg dividerede antallet af kombinationsmuligheder 526*10 med 4 i stedet for 2 (idet jeg dividerede både 526 med 2 og 10 med 2, hvilket var dobbeltkonfekt).

Nu til Christians argument. Det kører på en lidt anden måde. Han siger: For at to mænd skal kunne have samme kombination af de sidste 4 cifre må de nødvendigvis have en kombination af de første 6 som har den samme rest ved division med 11. Det er korrekt, givet den modulus-11 konstruktion som bestemmer det sidste ciffers værdi. To mænd får naturligvis kun samme kombination af de første 6 cifre modulus 11 i 1/11 af tilfældene (under de sædvanlige antagelser om ligelig fordeling, som dog ikke holder 100% i praksis). Givet at to mænd så har samme kombination af de første 6 cifre modulus 11, hvad er sandsynligheden for at de deler de sidste 4 cifre? Jo, vi kan starte med at se bort fra det 10. ciffer, for det vil være entydigt bestemt når cifrene 1 til 9 er bestemt. Så vi behøver kun at se på sandsynligheden for at cifrene 7 til 9 er de samme. Der er 526 mulige kombinationer af disse cifre. Men halvdelen af disse vil give et lige slutciffer, og 1/11 af dem vil give et checkciffer på 10. Altså står vi tilbage med kun 526(1/2)(10/11) kombinationsmuligheder. Den betingede sandsynlighed for at cifrene 7 til 10 er identiske givet at de vægtede summer af cifrene 1 til 6 er kongruente modulus 11 bliver altså:

1/(526(1/2)(10/11)).

Hermed bliver den ubetingede sandsynlighed for at dele de sidste 4 cifre:

(1/11)1/(526(1/2)(10/11)) = 1/(5265).

Det er præcist samme sandsynlighed som i beregningen ovenfor med den anden metode (min oprindelige metode)!

Det der sker her er at modulus-tallet 11 bliver divideret ud af regnskabet. Og det skal det! Man kan vise at sandsynligheden ikke afhænger af hvilket tal man bruger som basis for checksumsberegningerne, og derfor behøver det ikke indgå i sandsynlighedsberegningen. Man kan selvfølgelig vælge at lade det indgå, som Christian, men det vil under alle omstændigheder blive divideret ud til sidst. Men Christians betragtning har naturligvis den fordel at han fik afsløret min oprindelige fejl med at få divideret med 2 en gang for meget.

Lad mig opsummere: Både min oprindelige og Christians argumentation burde virke. Jeg havde blot lavet en dum fejl som gjorde at mit tal blev det dobbelte af det som det burde være. Christian fik påpeget dette, men lidt indirekte, via et ret anderledes argument. Hvis man ellers kan finde ud af at regne rigtigt (som åbenbart gælder for Christian, men ikke mig selv), er begge argumenter lige gyldige.

Mvh.

Thomas

  • 0
  • 0