Det er måske ikke helt overraskende at opdage, hvor lille afstanden er mellem, hvad man siger og peger på, og hvilken person man er. Alligevel er det tankevækkende at se, hvor let den slags ofte sensitive informationer kan trækkes ud af internettet og gøres til genstand for en forretning.
Ganske få ’likes’ på Facebook er nok til med 75-95 procents sandsynlighed at finde ud af, om du er mand eller kvinde, sort eller hvid, homo eller hetero, demokrat eller republikaner, kristen eller muslim. Det viser et studie af 58.466 frivillige amerikanske Facebookbrugere, som er blevet publiceret i fagbladet PNAS.
Undersøgelsen blev foretaget af de to psykometrikere Michal Kosinski og David Stillwell fra University of Cambridge i samarbejde med datalogen Thore Graepel fra Microsoft. Den viser, hvordan man ganske akkurat kan beregne parametre som intelligens, personlighedstype, stofmisbrug (alkohol, cigaretter, hash, etc.), graden af lykke og forældrenes ægteskabelige status, bare ved at kigge på de likes en person uddeler, mens han eller hun sidder og læser venners updates på Facebook og i det hele taget surfer på nettet.
Analysen foretages automatisk af en computeralgoritme, der har lært, hvilke likes der passer bedst til hvilke personlighedstræk.
Mange af de likes, der var bedst til at bestemme en person, var overraskende:
• Bøsser afsløres af likes for ‘Mac Cosmetics’ og ‘Human Rights Campaign’.
• Heteroer foretrækker at like ‘Wu-Tan Clan’ og ‘Foot Locker’.
• Likes for ‘Hello Kitty’ fortæller, at man har en åben personlighedstype, er sort, stemmer på demokraterne og måske ikke er helt så emotionel stabil som gennemsnittet.
• Likes for ‘curly fries’ og ‘thunderstorms’ fortæller, at du sandsynligvis har en høj intelligens.
• Likes for ‘Harley Davidson’, ‘Lady Antebellum’ og ‘I love being a Mom’ placerer dig i den mindre intelligente ende.
• Har man mange venner på Facebook, liker man gerne ‘Mojo-Jojo’ og ‘Dollar General’.
• Har man få Facebook-venner, foretrækker man ‘Minecraft’ og ‘The Dark Knight’.
• Er man til stoffer, liker man gerne ‘Austin Texas’ og ‘Big Momma Movies’, hvorimod de cleane foretrækker ‘Swimming’ og ‘Milkshakes’.
Se hele listen her
Gratis profiler til arbejdsgivere og pensionsselskaber
Forskerne var selv meget overraskede over, hvor god deres algoritme var. Om du er sort eller hvid kunne afgøres med 95 procents nøjagtighed. Køn kan bestemmes med 93 procents sikkerhed. Om du er bøsse eller ej med 88, demokrat eller republikaner med 85, og om du er kristen eller muslim med 82 procents nøjagtighed (se søjlediagram).
Algoritmen lærer ved først at opdele og så matche alle likes med relevante selvrapporterede informationer. Derefter bruges en såkaldt lineær regressionsmodel, der transformerer alle likes til en sandsynlighedsscore for de personlighedstræk, der kan angives som tal, f.eks. intelligens eller alder. For de mere indirekte personlighedsoplysninger, som for eksempel seksuel orientering eller stofmisburg, brugte forskerne en logistisk regressionsmodel, der er i stand til at forudsige udfaldet af kategori-afhængige variable, som ikke kan gives en numerisk værdi.
Læs også: Crowdsourcing - ny vej til bedre eksperimenter
Ved at krydsvalidere resultaterne på tværs af populationen kunne psykometrikerne hurtigt generere en stabil profil, der matcher eller er bedre end de eksisterende personlighedprofilundersøgelser, som bruges på jobmarkedet eller i personlighedstest. Og jo flere likes en person uddeler, desto nemmere bliver det.
Da informationerne kan genereres automatisk og de fleste like-sider på Facebook stadig er offentligt tilgængelige, vil teknikken blive meget interessant for kommercielle aktører og også for arbejdsgivere, forsikringsselskaber og eventuelt repressive regeringer. At kunne downloade en detaljeret personlighedsprofil for en hvilken som helst person gratis fra nettet er ikke noget, man kan sige nej til. Så nu venter vi bare på app'en.
