Google melder Go for digital intuition

20. marts 2016 kl. 12:006
Sejren for Googles AlphaGo over topspilleren Lee Sedol 4-1 i en historisk Go-match markerer et afgørende gennembrud for kunstig intelligens.
Artiklen er ældre end 30 dage

Det var en milepæl inden for computerteknologi, da IBM’s Deep Blue i 1997 slog den regerende verdensmester Gary Kasparov med cifrene i 3½-2½ i en match over seks partier.

Forskningen inden for kunstig intelligens har i denne uge oplevet samme succes og opmærksomhed, efter at computerprogrammet AlphaGo, udviklet af det Google-­ejede selskab DeepMind, har slået en af verdens allerbedste Go-­spillere gennem tiderne, Lee Sedol fra Sydkorea, med cifrene 4-1.

Sejren kommer, efter at AlphaGo i januar slog europamesteren Fan Hui med 5-0.

Læs også: Gennembrud inden for digital intuition: Google-program slår europamesteren i brætspillet Go

Artiklen fortsætter efter annoncen

Go er et brætspil, der er meget sværere end skak at analysere for såvel mennesker som maskiner, så triumfen er på mange måder mere imponerende for AlphaGo end den var for Deep­ Blue.

Meget kendetegnende måtte udviklerne, som selv spiller Go på amatørniveau, erfare fra ekspertkommentatorerne, at AlphaGo gjorde en grov fejl i begyndelsen af det sidste parti, da den faldt i en fælde, som Lee Sedol satte op. Fra dette dårlige udgangspunkt kæmpede AlphaGo sig dog tilbage og vandt et tæt parti, da Lee Sedol gav op efter 280 træk.

DeepMind blev overtaget af Google i 2014, og firmaets grundlægger, Demis Hassabis, betegnede sidste parti som ‘mindblowing’.

Lee Sedol erkendte nederlaget, men fortalte, at det især i begyndelsen var svært for ham ud fra et psykologisk perspektiv at spille mod AlphaGo.

Artiklen fortsætter efter annoncen

Lee Sedols ene sejr kom i fjerde parti, hvor han så at sige satte alt på et bræt med en anden strategi end i de tre første partier. AlphaGo så ud til have overhånden i begyndelsen af spillet, men Lee Sedols helt overraskende træk nr. 78 – som hverken ekspertkommentatorer eller AlphaGo havde set komme – og AlphaGos forkerte reaktion herpå, vendte hele partiet rundt.

Lee Sedol vurderede, at AlphaGo var stærkest, når programmet spillede hvid. I et forsøg på at bevise, at han også kunne slå programmet, når det var bedst, insisterede han på at have sort i sidste parti. Det lykkedes ham ikke at vinde, men det var tæt.

Go kontra skak

I Go skiftes to spillere til at placere hvide og sorte brikker (sten) på et bræt med 19 x 19 placeringer. Sort begynder. Det gælder om at omringe så mange af modstandernes sten som muligt, som så fjernes fra brættet efter at være omringet.

Der er typisk ca. 250 mulige positioner for placeringen af den næste sten, for hvilke der igen er omkring 250 muligheder for modstanderen til at placere en sten, osv. Der er skønsmæssigt omkring 10^170 forskellige Go-spil.

For skak er de tilsvarende tal henholdsvis 35 og 10^47. Analysen af skakspil lettes desuden af, at brikkerne har forskellig værdi.

Lidt hårdt trukket op kan man sige, at Deep Blues sejr viste, at når det gælder rå regnekraft og analyse, så er maskiner mennesker overlegne. Imponerende, men ikke mere overraskende, end at kraner kan løfte tungere vægte end de bedste vægtløftere.

Go er et spil, hvor rå regnekraft hverken i dag eller i nogen forudsigelig fremtid vil være nok. Der skal mere til.

AlphaGos sejr viser, at maskiner også kan besidde intuition, som inden for visse områder kan måle sig med menneskelig intuition. Som i andre komplicerede brætspil er Go et spil, hvor der findes gode og dårlige strategier og trækkombinationer, men det er er også et spil, hvor de bedste Go-spillere i mange tilfælde har sværere ved at begrunde et bestemt træk end de bedste skakspillere. Det gør det vanskeligt at overføre erfaring til en maskine.

Selvlærende program

Det er ikke Demis Hassabis og de øvrige forskere og ingeniører ved DeepMind, der har lært AlphaGo at spille Go. Det har programmet selv gjort ved at studere millionvis af brætpositioner og spille tusindvis af gange mod andre spillere og sig selv.

Forskerne har udstyret AlphaGo med to netværk. Et policy-netværk udvælger ud fra tommelfingerregler og generelle principper et mindre antal af de mange mulige træk, som et efterfølgende value-netværk med rå regnekraft derefter analyserer i detaljer.

AlphaGo er altså ikke ren intui­tion. Med 1.920 standardprocessorer og 280 specialdesignede processorer er den maskine, AlphaGo kører på, noget kraftigere end de bedste personlige computere nu om dage.

Artiklen fortsætter efter annoncen

Det er naturligvis ikke et mål i sig selv at lave bedre og bedre Go-­computere. Demis Hassabis fortalte efter matchen, at man hjemme hos firmaet i England nu vil overveje de næste skridt.

Han har tidligere forklaret, at metoderne bag AlphaGo med fordel kan anvendes inden for en lang række andre discipliner, hvor beslutninger skal træffes ud fra stort datamateriale.

AlphaGo viser, at denne form for kunstig intelligens har en stor fremtid. Det betyder dog ikke, at mennesker helt kan slippe for at tænke selv. Der går nok ikke lang tid, før en maskine kan stille en sygdomsdiagnose bedre end de fleste læger, men samme maskine kan næppe prioritere en rækkefølge for operationer eller bruge sin viden til at beslutte, hvilke former for nyt udstyr, hospitaler skal indkøbe.

AlphaGos sejr over Lee Sedol viser, at kunstig intelligens har nået et niveau, hvor anvendelserne står i kø, dog uden at den i alle forhold er sammenlignelig med menneskelig intelligens.

6 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
6
21. marts 2016 kl. 16:24

https://en.wikipedia.org/wiki/Computer_bridge

Et par citater fra wikipedia:

A series of articles published in 2005 and 2006 in the Dutch bridge magazine IMP describes matches between five-time computer bridge world champion Jack and seven top Dutch pairs including a Bermuda Bowl winner and two reigning European champions. A total of 196 boards were played. Jack defeated three out of the seven pairs (including the European champions). Overall, the program lost by a small margin (359 versus 385 imps).

Jack er p.t. verdens bedste bridge-computer og kan spille nogenlunde lige op med verdensklassen - men har ikke overbevisende slået et hold i verdensklasse - men det skal nok komme!

In comparison to computer chess, computer bridge is in its infancy. Yet, whereas computer chess has taught programmers little about building machines that offer human-like intelligence, more intuitive and probabilistic games such as bridge might provide a better testing ground. The question whether bridge-playing programs will reach world-class level in the foreseeable future is not easy to answer. Computer bridge has not attracted an amount of interest anywhere near to that of computer chess. On the other hand, researchers working in the field have accomplished most of the current progress in the last decade. Irrespective of the results of computers against humans in tournament bridge, computer bridge already has changed the analysis of the game. Commercially available double-dummy programs can solve bridge problems in which all four hands are known, typically within a second. These days, few editors of books and magazines will solely rely on humans to analyse bridge problems before publications. Also, more and more bridge players and coaches utilize computer analysis in the post-mortem of a match.

5
21. marts 2016 kl. 15:54

Når en maskine overbevisende kan vinde over verdens bedste i bridge, så kan vi for alvor begynde at tale om noget, der ligner menneskelig intuition.

Prøvede lige en hurtig google. Et par citater fra "The State of Automated Bridge Play" fra 2010:

https://cs.nyu.edu/~pbethe/bridgeReview200908.pdf

Computer bridge players have surpassed humans in the time they take to solve
double-dummy problems, and the best programs are attaining expert status as
card players. They do not yet handle all the nuances of deceptive play, and due
to the constrained medium for exchange as well as the tactical and destructive
considerations, computer bidding is still a work in progress.</p>
<p>...</p>
<p>With all these problems and sub-problems, it appears researchers still have
a lot of work ahead of them to create a bridge player to rival the top experts.

Det lyder som om udfordringen er at få vurderet modstanderens spil korrekt så man ikke bliver snydt. Omvendt er det jo det problem man møder i poker, og der er tilsyneladende nogle der arbejder på det:

https://www.livescience.com/50868-poker-playing-artificial-intelligence.html

4
21. marts 2016 kl. 08:36

Det er absolut imponerende, men Go (og skak) er een ting - Bridge er noget helt andet. Når en maskine overbevisende kan vinde over verdens bedste i bridge, så kan vi for alvor begynde at tale om noget, der ligner menneskelig intuition.

3
21. marts 2016 kl. 07:11

Go er også lineær logik

Er du sikker på det? Uden i øvrigt at kunne finde ud af spillet så er min konklusion fra at have læst AlphaGo-artiklen i Nature at selvom man kan komme et stykke med logik, så kan man ikke slå en verdensmester med det.

Der står dog også i artiklen at delen med det neurale netværk ikke er i stand til at slå en verdensmester heller. Der skal åndssvagt meget rå regnekraft til.

En helt anden ting er at AlphaGo har haft adgang til en kolossal database af menneskelige Go-spil.

Det er lidt uklart hvor langt man overhovedet kan komme ved bare at lade den spille mod sig selv. Kunne den f.eks. blive dygtig nok til ikke at tabe en eneste kamp mod Lee Sedol? Jeg tvivler lidt. Lee Sedol er jo heller ikke blevet dygtig ved blot at spille mod sig selv.

Det er selvfølgelig vildt at de kan slå en verdensmester. Men omvendt har det måske mest symbolsk betydning - DeepMind virker på mig som anvendelsesorienteret forskning i den betydning at de afprøver en masse kendte teknikker på simple computer- og brætspil, og ser hvor langt de kan komme.

AlphaGo er en blandet algoritme hvor man kører flere forskellige uafhængige teknikker samtidigt og agerer ud fra et vægtet gennemsnit af disse (wisdom of the crowd). I Go's tilfælde sker der nok det at der bliver udviklet nogle flere teknikker og kombineret, og så ender man på et tidspunkt med noget der kan slå en verdensmester uden at skulle bruge et 200 GPUs cluster.

2
21. marts 2016 kl. 06:44

...men: "(...) men samme maskine kan næppe prioritere en rækkefølge for operationer eller bruge sin viden til at beslutte, hvilke former for nyt udstyr, hospitaler skal indkøbe."

Nej, måske ikke samme maskine, hvis det var dét der var tryk på.

Men ellers vil jeg mene, at udtrykket "men der går nok længere tid inden samme maskine kan prioritere en rækkefølge for operationer (...)" er mere præcist.

Hvis denne udvikling fortsætter, så vil der til sidst ikke være noget som maskinerne ikke kan gøre bedre end mennesker.

1
20. marts 2016 kl. 17:22

Skak er "lineær" logik, Go er også lineær logik, men at mestre conversation er meget sværere, når videnskaben har mestret konversation, så er der er meget stort salgspotentiale, både på det private og kommercielle marked .