Google melder Go for digital intuition
Det var en milepæl inden for computerteknologi, da IBM’s Deep Blue i 1997 slog den regerende verdensmester Gary Kasparov med cifrene i 3½-2½ i en match over seks partier.
Forskningen inden for kunstig intelligens har i denne uge oplevet samme succes og opmærksomhed, efter at computerprogrammet AlphaGo, udviklet af det Google-ejede selskab DeepMind, har slået en af verdens allerbedste Go-spillere gennem tiderne, Lee Sedol fra Sydkorea, med cifrene 4-1.
Sejren kommer, efter at AlphaGo i januar slog europamesteren Fan Hui med 5-0.
Læs også: Gennembrud inden for digital intuition: Google-program slår europamesteren i brætspillet Go
Go er et brætspil, der er meget sværere end skak at analysere for såvel mennesker som maskiner, så triumfen er på mange måder mere imponerende for AlphaGo end den var for Deep Blue.
Meget kendetegnende måtte udviklerne, som selv spiller Go på amatørniveau, erfare fra ekspertkommentatorerne, at AlphaGo gjorde en grov fejl i begyndelsen af det sidste parti, da den faldt i en fælde, som Lee Sedol satte op. Fra dette dårlige udgangspunkt kæmpede AlphaGo sig dog tilbage og vandt et tæt parti, da Lee Sedol gav op efter 280 træk.
DeepMind blev overtaget af Google i 2014, og firmaets grundlægger, Demis Hassabis, betegnede sidste parti som ‘mindblowing’.
Lee Sedol erkendte nederlaget, men fortalte, at det især i begyndelsen var svært for ham ud fra et psykologisk perspektiv at spille mod AlphaGo.
Lee Sedols ene sejr kom i fjerde parti, hvor han så at sige satte alt på et bræt med en anden strategi end i de tre første partier. AlphaGo så ud til have overhånden i begyndelsen af spillet, men Lee Sedols helt overraskende træk nr. 78 – som hverken ekspertkommentatorer eller AlphaGo havde set komme – og AlphaGos forkerte reaktion herpå, vendte hele partiet rundt.
Lee Sedol vurderede, at AlphaGo var stærkest, når programmet spillede hvid. I et forsøg på at bevise, at han også kunne slå programmet, når det var bedst, insisterede han på at have sort i sidste parti. Det lykkedes ham ikke at vinde, men det var tæt.
I Go skiftes to spillere til at placere hvide og sorte brikker (sten) på et bræt med 19 x 19 placeringer. Sort begynder. Det gælder om at omringe så mange af modstandernes sten som muligt, som så fjernes fra brættet efter at være omringet. Der er typisk ca. 250 mulige positioner for placeringen af den næste sten, for hvilke der igen er omkring 250 muligheder for modstanderen til at placere en sten, osv. Der er skønsmæssigt omkring 10^170 forskellige Go-spil. For skak er de tilsvarende tal henholdsvis 35 og 10^47. Analysen af skakspil lettes desuden af, at brikkerne har forskellig værdi.Go kontra skak
Lidt hårdt trukket op kan man sige, at Deep Blues sejr viste, at når det gælder rå regnekraft og analyse, så er maskiner mennesker overlegne. Imponerende, men ikke mere overraskende, end at kraner kan løfte tungere vægte end de bedste vægtløftere.
Go er et spil, hvor rå regnekraft hverken i dag eller i nogen forudsigelig fremtid vil være nok. Der skal mere til.
AlphaGos sejr viser, at maskiner også kan besidde intuition, som inden for visse områder kan måle sig med menneskelig intuition. Som i andre komplicerede brætspil er Go et spil, hvor der findes gode og dårlige strategier og trækkombinationer, men det er er også et spil, hvor de bedste Go-spillere i mange tilfælde har sværere ved at begrunde et bestemt træk end de bedste skakspillere. Det gør det vanskeligt at overføre erfaring til en maskine.
Selvlærende program
Det er ikke Demis Hassabis og de øvrige forskere og ingeniører ved DeepMind, der har lært AlphaGo at spille Go. Det har programmet selv gjort ved at studere millionvis af brætpositioner og spille tusindvis af gange mod andre spillere og sig selv.
Forskerne har udstyret AlphaGo med to netværk. Et policy-netværk udvælger ud fra tommelfingerregler og generelle principper et mindre antal af de mange mulige træk, som et efterfølgende value-netværk med rå regnekraft derefter analyserer i detaljer.
AlphaGo er altså ikke ren intuition. Med 1.920 standardprocessorer og 280 specialdesignede processorer er den maskine, AlphaGo kører på, noget kraftigere end de bedste personlige computere nu om dage.
Det er naturligvis ikke et mål i sig selv at lave bedre og bedre Go-computere. Demis Hassabis fortalte efter matchen, at man hjemme hos firmaet i England nu vil overveje de næste skridt.
Han har tidligere forklaret, at metoderne bag AlphaGo med fordel kan anvendes inden for en lang række andre discipliner, hvor beslutninger skal træffes ud fra stort datamateriale.
AlphaGo viser, at denne form for kunstig intelligens har en stor fremtid. Det betyder dog ikke, at mennesker helt kan slippe for at tænke selv. Der går nok ikke lang tid, før en maskine kan stille en sygdomsdiagnose bedre end de fleste læger, men samme maskine kan næppe prioritere en rækkefølge for operationer eller bruge sin viden til at beslutte, hvilke former for nyt udstyr, hospitaler skal indkøbe.
AlphaGos sejr over Lee Sedol viser, at kunstig intelligens har nået et niveau, hvor anvendelserne står i kø, dog uden at den i alle forhold er sammenlignelig med menneskelig intelligens.
