Det kan være klogt at være dum

Det kan være klogt at være dum

I en kompleks verden, hvor alle forsøger at få et godt liv, er det ikke altid bedst at være egoistisk. Det kan være klogt at være flink og tænke på næsten. Det er også smart at være skør. Og nogle gange kan det hjælpe at være sin egen værste fjende.

Pokerstjernen Gus Hansen har ry for at være heldig. Der sker ofte dette: Netop når modstanderen forsøger at straffe Gus for hans evigt irriterende aggressive bud med dårlige kort, har danskeren en super hånd og vinder hele potten.

Men det har ikke noget med held at gøre. Gus' aggressive stil er et behændigt udviklet table image. Og at kunne udnytte sit table image til egen fordel er et af de vigtigste våben i professionel poker.

Matematisk spilteori er ikke i nærheden af at kunne beskrive kompleksiteten i den slags avancerede strategispil fra det virkelige liv. Men den er så småt begyndt at kunne forklare, hvorfor skøre indfald, dårlige bud og direkte ukloge handlinger kan betale sig i et ellers, formelt set, logisk og rationelt spilunivers.

Matematisk spilteori er stadig alt for simpel til at kunne hamle op med udspekulerede pokerspillere som Gus Hansen. (Tegning: Lars Refn)

En af de nye forklaringsmodeller, som er udviklet af David Wolpert fra Nasa Ames Research Center i Californien, er netop at bruge Gus' metode: At adoptere et passende image, som signalerer til de andre, at de med fordel kunne ændre deres egen adfærd. Hvis det lykkes, vil han fremstå som "dum", men øge sin egen gevinst.

Spilteoriens anormale form

Siden den moderne matematiske spilteori blev introduceret af John von Neumann og Oskar Morgenstern i 1944 med bogen "Theory of Games and Economic Behavior" er der udviklet et hav af anvendelser inden for områder som økonomi, evolutionær psykologi, økologi, antropologi og ikke mindst politisk videnskab.

I lang tid har spilteorien dog rodet rundt med at finde ligevægtsstrategier (kaldet Nash-ligevægte) ud fra en antagelse om, at aktørerne vil handle rationelt og egoistisk for at optimere deres udbytte. Men dette er sjældent optimalt.

Lad os tage et eksempel: Spilteori vurderer, hvilken strategi jeg i konkurrence med andre aktører bør benytte for at opnå det bedst mulige resultat. Grafisk kan den bedst illustreres ved en såkaldt payoff matrix, hvor jeg kan se, hvor meget jeg vil vinde ved enten at samarbejde eller modarbejde med min modstander.

(0;0) i feltet samarbejde/samarbejde betyder, at jeg får en payoff på 0, og min modstander også. Til gengæld får jeg 6 point, hvis jeg samarbejder og min modstander modarbejder. Han får så 1 point.

Hvis vi begge ville handle perfekt rationelt, burde jeg samarbejde (og få 6 point) og min modstander modarbejde (og få 1 point), fordi enhver egenhændig afvigelse fra denne strategi vil mindske udbyttet (hvis jeg pludselig ville modarbejde i stedet, ville jeg kun få 4 point, og hvis min modstander pludselig ville samarbejde, ville han få 0 point). Tilstanden (6;1) kaldes derfor en Nash-ligevægt, og hvis en spiller afviger fra denne ligevægt defineres han som "ikke rationel".

Men det er tydeligt ud fra matrixen, at min modstander vil have mig til at modarbejde, koste hvad det vil. En Gus Hansen-strategi kan her være nyttig: at handle irrationelt og skifte mellem samarbejde og modarbejdelse på en tilfældig måde.

Hvis Gus adopterer en sådan tilfældig strategi, vil jeg halvdelen af tiden få 6 point og halvdelen af tiden 0 point, altså et gennemsnit på 3 point. Derfor er det bedst, at jeg skifter min strategi også, og altid modarbejder, for så vil jeg have et gennemsnit på 4,5, ligegyldigt hvad Gus gør.

Det er netop, hvad "The Great Dane" har ventet på! Gus' gennemsnitlige udbytte vil stige til hele 5,5 point. Og det er mere, end hvad jeg får.

Hvis Gus havde været rationel, ville jeg have fået 6 point, og han 1 point. Men nu, hvor hans uforudsigelige table image har fået mig til at skifte strategi, vil jeg få mindre, og han vil få mere.

At reparere teorien

Eksempler som dette og "Den rejsendes dilemma", der beskrives nedenfor, har gjort, at spilteoriens faktiske anvendelser indtil videre har været en blandet succes. Gang på gang har det vist sig, at folk enten samarbejder frivilligt, handler irrationelt eller mod bedre vidende.

De største og vigtigste resultater i spilteorien har derfor ofte kredset om årsager til, at mennesker ikke er rationelle aktører. Hele otte Nobelpriser er det blevet til inden for feltet, og spilteorien fortsætter med at finde frugtbare paradokser mellem teori og det virkelige liv.

Hvordan reparere spilteorien? Eksemplet med den rejsende viser, at argumentet om, at folk er altruistiske eller bare velopdragne, ikke holder. En stor del af problemet synes at ligge i, at spilteorien har en meget rigid definition af, hvad der er rationelt. Gambling handler for eksempel ikke om rationalitet, men om at maksimere sit udbytte.

Image forklarer irrationalitet

David Wolpert og hans kollegers idé om, at folk adopterer forskellige personligheder til forskellige situationer, kan indeholde kimen til at løse de mange spilteoretiske paradokser. I deres artikel viser de, hvordan image-teorien kan forklare forskellen på de eksperimentelle og teoretiske data.

Hvis man for eksempel tager højde for, at ens modstander ikke vil være rationel og byde sølle 20 kroner i eksemplet med de rejsende, og inkorporerer det i sine beregninger, vil gennemsnittet stige til 970-980 kroner - det samme, som man ser i eksperimenterne.

Modellen er selvsagt stadig meget grovkornet og vil ikke kunne bruges i professionel poker. Den indeholder kun to "images": det perfekt rationelle og det tilfældige. Men en udvidelse af ideen til et kontinuum af images vil givetvis kunne gøre spilteorien meget mere anvendelig i det virkelige liv. Fænomener som anti-rationalitet, altså mennesker der bevidst handler som deres egen værste fjende, kan ifølge forskerne også føre til et større udbytte.

Modellen indeholder eksempler på spil, hvor alle spillere handler mod deres egne interesser, og stadig får de alle et større udbytte, end hvis de havde handlet rationelt.

Også det klassiske fangedilemma kan pludselig ses i et nyt lys (se eksemplet "Fangedilemmaet" nedenfor). Eksperimenter har gang på gang vist, at det ikke er den "rationelle" Nash-ligevægt, der bliver valgt, men samarbejdet. Wolpert og co. kan forklare det via image-teorien, uden at man behøver at involvere gentagede forsøg. Også i det såkaldte "Ultimatumspil" kan man med fordel anvende image-teorien.

Men hvis du nu tror, at du kan slå Gus Hansen i poker, må du desværre tro om. Matematisk spilteori er stadig alt for simpel til at kunne hamle op med udspekulerede pokerspillere, som har udviklet et langt større arsenal af tricks til at score kassen end bare deres ry.

Eksempel 1: Den rejsendes dilemma

Netop spyttet ud af lufthavnens underjordiske katakomber ligger din kuffert på bagagebåndet som en sammenkrøllet coladåse. Med bange anelser åbner du kufferten langsomt. Den antikke vase, som du så omhyggeligt havde pakket ind skumplast, pap og en tyk bluse, er transformeret til et puslespil i 13 dele.

Flyselskabets repræsentant siger, at man kan betale erstatning på mellem 20 og 1.000 kroner. Det eneste, du skal gøre, er at angive vasens reelle værdi. Men repræsentanten siger også, at man har modtaget et krav om erstatning fra en anden passager, der havde præcis den samme vase som du havde, og som også er gået i stykker.

Hvis I begge angiver det samme beløb, vil flyselskabet kunne være sikker på at I taler sandt, og udbetale pengene. Men hvis den ene angiver en lavere værdi end den anden, vil flyselskabet udbetale den laveste værdi til begge - dog med en straf på 20 kroner til den, som har angivet den høje værdi, og en bonus på 20 kroner til den, som har angivet den lavere og "mere ærlige" værdi.

Din første impuls er at skrive grådige 1.000 kroner på blanketten. Men fordi du er matematisk skolet, aner du, at det ikke er optimalt. Hvis du angiver 990 kroner i stedet, vil du få mere ud af det, ligegyldigt hvad din medpassager skriver. For hvis hun skriver 1.000 og du 990, vil resultatet være at du får 1.010 (990 + 20 bonus) og din medpassager 970 (990 - 20 straf). Og hvis hun også skriver 990, vil I begge få 990, hvilket jo stadig er mere end de 980 som du ville have fået, hvis du skrev 1.000. Og hvis hun byder mindre, vil det jo ikke gøre nogen forskel om du skrev 1.000 eller 990.

Men inden det første 9-tal er nedskrevet, løber det koldt ned ad ryggen på dig, og du stopper. Din medpassager kan ikke være andre end den udspekulerede børsmæglerdame, som sad ved siden af dig under turen. Hun er ubarmhjertig og ekstremt intelligent. Hun vil helt sikkert have tænkt det samme som dig. Dit ry for at være et rationelt geni er på spil. Det er derfor klogt at skrive 980 af samme grund som det var klogt at skrive 990. Men hov, det ved hun også! Lad os skrive 970, eller 960... nej, 950... nej, 940...

Her ligger problemet i en nøddeskal: Under antagelse af, at begge passagerer er perfekt rationelle og perfekt egoistiske vil de i sidste ende skulle skrive 20 kroner på blanketten. Det er desværre lige så logisk som det er vanvittigt.

Spilteoretikere har lavet eksperimenter i det virkelige liv for at se, om folk nu også opfører sig som teorien påbyder. Og det viser sig at de opfører sig helt anderledes. Gennemsnittet ligger et sted mellem 900 og 1.000 kroner, langt fra Nash-ligevægten, og selv skolede spilteoretikere kunne ikke finde på at byde sølle 20 kroner. Spørgsmålet er derfor: Hvordan reparere spilteorien, så den kan forklare den virkelige verden?

Eksempel 2: Fangedilemmaet

Jeg og min kollega Kurt er mistænkt for et mord. Vi placeres af politiet i to forskellige celler, så vi ikke kan tale med hinanden. Politiet har ikke nok beviser til at overbevise dommeren om vores skyld, og tilbyder hver af os en handel: Hvis jeg tilstår og vidner mod Kurt, kan jeg gå fri, mens Kurt får ti år, hvis han vel at mærke intet siger. Det omvendte gælder også for Kurt. Hvis ingen af os tilstår, vil vi begge få en mildere straf (et år), og hvis vi begge tilstår, vil vi begge få fem år.

Jeg kender tilfældigvis Kurt, og han er en udspekuleret psykopat. Lige meget hvad jeg vælger, vil han vide, at han altid får en mildere straf ved at stikke mig. Enten vil han få fem år i stedet for ti (hvis jeg stikker ham) eller han vil gå fri i stedet for at få et år bag tremmer (hvis jeg forbliver tavs). Den åbenlyse strategi for Kurt er derfor ikke at samarbejde og stikke mig.

Hvis jeg analyserer situationen på samme måde, som han gør, vil vi begge stikke hinanden og få fem år, selv om vi begge potentielt kunne have nøjedes med ét. Rationel handling fører altså til et dårligere resultat. Det er dilemmaet. Eksempler fra det virkelige liv (for eksempel i cykelløb hvor to udbrydere er kommet væk fra feltet, hvilket er en tilsvarende situation) viser dog, at folk som regel vælger samarbejdet.

I det gentagede fangedilemma, hvor det samme spil gentages uendeligt mange gange, ser tingene anderledes ud. Nu kan man udvikle strategier, alt efter hvad den anden gjorde tidligere. I den situation viser det sig, at samarbejde til at starte med opstår som tit-for-tat (TFT) - en strategi, der starter med at samarbejde, men derefter gør mod modstanderen, hvad vedkommende selv gjorde i forrige træk. Den berømte spilteoretiker Robert Axelrod inviterede i 1978 folk til at sende ham strategier, som så kunne konkurrere mod hinanden på computeren. Tit-for-tat vandt i flere omgange.

Kommentarer (4)

Rationel handling fører altså til et dårligere resultat.

En egoistisk, egensindig og egenhændig måde, fører til bedste resultater KUN hvis man tilfældigvis er meget bedre (i forhold til et behov) end den flok af mennesker som man tilfældigt i en situation kan vælge at samarbejde med.

Derfor er holdsamarbejde så vigtigt. Gode teams vinder altid, medmindre at en modstander er et geni. Derfor: Vurdér, hvem du har med at gøre, når en opgave skal løses.

Psykopater vælger altid en mellemløsning. De ved, at resultater fra et team er uundværligt, og derfor narrer de et team til at bidrage, for dernæst at sjæle resultatet i eget navn. En metode, der giver forbavsende gode resultater i store organisationer, hvor mange mennesker ikke kender hinanden, så gode at en psykopat kan nå at blive forfremmet adskillige gange, før sandheden måske indhenter, og da har psykopaten smadret karrieren for mange andre i mellemtid. »Det kan være klogt at være en tyv og løgner.« Psykopater har som bekendt ingen samvittighed, sover godt om natten uanset hvad.

Iblandt mine første oplevelser i en koncern, husker jeg især, at det var umuligt at få hjælp fra fremmede afdelinger, fordi, når man kom og bad om hjælp, da blev man mistænkt for at være en psykopat der ville stjæle og siden lyve. Min løsning var at spotte genierne i sådanne fremmede afdelinger, og vende tilbage til min chef, bede ham om på mine vegne og skriftligt at anmode om hjælp fra disse navngivne genier, via deres afdelingschef, fordi de alle i en sådan fremmed afdeling således ville vide at berømmelsen for gode resultater ville tilfalde også dem. En metode, som min chef ikke altid var glad for, fordi en sådan metode betød en officiel »gæld« som siden skal tilbagebetales, af ham, ikke af mig, men, når jeg kunne bevise at jeg havde kig på genier, var han enig. En metode som jeg kan anbefale, både som efterspørger og udbyder af viden, når en arbejdsplads er stor: Indbyrdes aftaler, sikkerhed om at dele æren, som giver venner i en koncern, i modsætning til fjender.

En metode, som forbavsende få mennesker er opmærksomme på, at barrierer kan fjernes således, så let. Avancement i koncerner, sker således aldrig på basis af kun et samarbejde i en afdeling, men lige så meget på basis af et samarbejde med mange andre afdelinger, for kun således beviser man, at man ønsker det bedste for sin arbejdsplads som helhed. Hvis ens egen afdeling mistænker at man ikke er en loyal købmand, eller hvis andre afdelinger mistænker at man ikke er en loyal købmand, da kommer man ingen vegne. Jeg havde engang en chef, han var afdelingschef for cirka hundrede ansatte, og som ophidset erklærede for mig: »Nu er hun faldet i kløften! Denne gang slipper hun ikke op igen, jeg skal stå og pisse på hende!« Han talte om en kvindelig chef, som jeg anså for at være dygtig, men som ikke var opmærksom på at hun ofte skadede andre afdelinger med sine projekter. En advarsel om, at hvis man begår en fodfejl, er man i alvorlige vanskeligheder, medmindre at man har venner, snarere end fjender.

  • 0
  • 0