Matematikeres computerprogram spiller perfekt poker

Matematikeres computerprogram spiller perfekt poker

Canadiske matematikere har udviklet computerprogrammet Cepheus, som spiller Texas Hold'em-poker med den optimale strategi. Det er umuligt at vinde mod programmet - prøv selv.

Det pokerprogram, som matematikere fra University of Alberta i Canada har udviklet, er ikke værd at spille imod. Man har nemlig ikke en chance.

Computeren er ikke til at slå, for den har gennemskuet spillet. Programmet Cepheus spiller Heads-up Limit Texas Hold'em på den mest optimale måde, så selv den stærkeste pokerspiller vil højst kunne drømme om at spille lige op mod computeren.

I samme ombæring har de canadiske matematikere bekræftet, at kortgiveren har en lille fordel i spillet. Resultaterne præsenteres i en videnskabelig artikel i tidsskriftet Science.

Michael Bowling og hans forskerhold på University of Alberta har fundet frem til den bedste pokerstrategi. (Foto: John Ulan, University of Alberta)

En strategi uden svagheder

Troels Bjerre Sørensen, der er adjunkt på IT-Universitetet i København, har beskæftiget sig med spilteori i mange år, og har da også været med til at finde frem til gode strategier for poker. Han forklarer det nye resultat sådan her:

»De har beregnet en minimax-strategi for spillet. Det betyder, at de har fundet den strategi, som klarer sig bedst muligt imod de stærkeste modstandere. Selv hvis strategien offentliggøres, og modstanderen studerer den og vælger den bedste modstrategi overhovedet, kan han ikke forvente at slå programmet.«

»Det er en strategi uden svagheder - uden huller. Der er intet, en modstander kan udnytte.«

Billiarder af muligheder

Texas Hold'em er verdens mest populære form for poker. Her får hver spiller to kort på hånden, og så gælder dem om at få den bedste pokerhånd med fem kort blandt sine egne kort kombineret med de fem fælleskort, der vendes på bordet.

Når der kun er to deltagere i spillet, og man kun kan satse faste beløb, kaldes spillet for Heads-up Limit Texas Hold'em, og det er dette spil, forskerne har fundet den bedste strategi for.

Læs også: 27 millioner pokerspil analyseret: Par to bedre end et par knægte

Heads-up Limit Texas Hold'em er et simplere spil end varianten uden loft og med flere deltagere, men der er immervæk stadig omkring 316.000.000.000.000.000 forskellige måder, kortene kan blive uddelt og satsningerne kan foretages.

De overvældende mange muligheder betyder, at forskerne trods alt ikke har fundet det helt præcise matematiske svar på, hvad den bedste strategi er. Men ved hjælp af en supercomputer, der har kørt i et par måneder, har de fundet en strategi, som er så tæt på at være optimal, at computeren ikke kan forventes slået, om så man er verdens bedste pokerspiller, der har fundet den optimale modstrategi, og som spiller mod den uafbrudt igennem et helt liv.

Ikke en pengemaskine

Selvfølgelig kan man være heldig at få gode hænder, så man kommer foran mod Cepheus. Men i længden har man altså ikke en chance for at vinde. Det betyder dog ikke nødvendigvis, at man får læsterlige klø af computeren. Den er nemlig ikke programmeret til at vinde stort, men kun til at undgå nederlag.

»Strategien har ikke særlig meget frihed til at udnytte modstanderens svagheder. Det er en meget sikker strategi at bruge. Men det ikke en, man kan bruge til at vinde en masse penge fra en svag modstander,« fortæller Troels Bjerre Sørensen.

Med lidt held kan man godt komme foran mod pokerprogrammet Cepheus, men i længden har man ikke en chance.

»Med denne strategi sikrer man sig mod tab - der en ingen huller i skjoldet. Man kan ikke tabe, men omvendt er der ingen garanti for, at man vinder. Mod en stærk modstander går man højst sandsynligt i nul.«

»Man skal bruge en anden strategi, hvis man vil udnytte svage spillere. Men sådan en strategi vil kunne blive udnyttet af stærke spillere. Når du sænker dit skjold for at hæve sværdet, så viser du dine egne svagheder.«

Manglende information er en udfordring

Som pokerspiller har man ikke overblik over, hvilke kort de øvrige spillere sidder med eller tidligere har smidt. På den måde adskiller poker sig fra spil som kryds-og-bolle, fire på stribe, dam eller backgammon, hvor begge spillere har adgang til al information om spillet. Man siger, at poker er et spil med uperfekt information.

Rent matematisk er det sværest at finde den bedste strategi for spil med uperfekt information, og derfor er det noget af en bedrift, at det nu er lykkedes.

Ifølge professor Michael Bowling, der stod i spidsen for den canadiske forskergruppe, har poker været en udfordring for forskere inden for kunstig intelligens i mere end 40 år, men det er altså først nu, det er lykkedes at knække spillet - eller i hvert fald varianten Heads-up Limit Texas Hold'em.

Kan give bedre sikkerhed

Resultatet kan ikke kun anvendes i forbindelse med poker. For spilteori bruges i mange sammenhænge. De metoder, forskerne anvendte for at komme frem til den optimale strategi for poker, kan for eksempel også føre til bedre strategier inden for sikkerhed, forklarer Troels Bjerre Sørensen:

»Denne type algoritmer bliver i stor stil anvendt i security-sammenhænge. I en lufthavn råder man over et begrænset antal vagter, og så gælder det om at sørge for, at de bliver placeret bedst muligt. Her kan man anvende algoritmer som denne til at finde ud af, hvordan vagter skal anbringes i lufthavnsområdet. Det er for eksempel sket i den store lufthavn i Los Angeles.»

»Den amerikanske kystbevogtning har også brugt lignende algoritmer til at bestemme de mest optimale ruter for skibe, der bevogter havne. Og for nyligt har man taget matematikken i brug for at finde de bedste arbejdsplaner for billetkontrollører i tog og busser, så de kan fange flest muligt, der rejser uden billet.«

»Det er alt sammen virkelige situationer med alt for meget information. Og så gælder det om at filtrere uvigtig information fra, så man får en kompakt model, der kan analyseres.«

Men her i første omgang er det altså et pokerprogram, der har fået lov til at udnytte den nye optimeringsmetode. Hvis man selv vil prøve kræfter mod det uovervindelige pokerprogram, kan man besøge Cepheus-gruppens website. En overbelastet server kan dog gøre det svært at få adgang til sitet.

Kommentarer (19)

Så ville det ende næsten uafgjort, med lige stor sandsynlighed for at den ene ender foran som at den anden gør. Det er faktisk sådan den har lært at spille poker; ved at "spille mod sig selv".

  • 0
  • 0

Troels,

Er der publiseret yderligere detaljer om projektet og CFR+ algorithmen?

Har leget en del med den 'traditionelle' CFRM metode, som jo er ganske godt beskrevet af Michael Johanson i hans afhandling fra 2007 "Robust Strategies and Counter-Strategies: Building a Champion Level Computer Poker Player"

Mvh.

  • 0
  • 0