BAGGRUND: Sådan finder computere planeter

Stjernesystem med otte exoplaneter ved stjernen Kepler 90. Illustration: NASA/Wendy Stenzel

Nasas Kepler satellit har allerede opdaget langt over 2.000 planeter i fremmede stjernesystemer - de såkaldte exoplaneter. Lige så mange observationer er foreløbig registreret som potentielle kandidater og afventer kun en videre vurdering.

Det kan derfor synes som en næsten triviel nyhed, da det i sidste uge blev meddelt, at man nu havde fundet to nye exoplaneter, hvoraf den ene var i et stjernesystem, der dermed nu officielt har lige så mange planeter som vores solsystem - otte.

Selv om det sidste blev slået stort op som en kæmpe nyhed mange steder, er det nu ret uinteressant. Metoden, der blev brugt til at finde de to exoplaneter, er derimod meget interessant.

Den har stadig sine klare begrænsninger, men kan potentielt med videreudvikling blive nyttig.

Fully connected neural network Illustration: Nasa/Google
Convolutional network Illustration: Nasa/Google

Det var nemlig et neuralt netværk, der havde lært sigt selv at finde planeter i Keplers mange data, der udpegede de to nye exoplaneter. Det illustrerer på bedste vis, at maskinlæring har mange anvendelser.

Et mere dybdegående studie af metoden viser dog også, at nok kan maskinlæring og neurale netværk bruges til at finde exoplaneter, men metoden har dog også sine begrænsninger,

Det fremgår tydeligt af den videnskabelige artikel om fundet af de to exoplaneter af Christopher J. Shallue fra Google Andrew Vanderburg fra University of Texas i Austin, Texas.

Artiklen er godkendt til optagelse i tidsskriftet The Astronomical Journal.

Sådan finder Kepler satellitter

Der findes flere måder til at bestemme planeter i stjernesystemer, der ikke kan ses direkte med selv de bedste teleskoper i rummet eller på Jorden, da de er små og mørke.

Kepler observerer en stjerne gennem længere tid, og hvis stjernens lysstyrke regelmæssigt synes at dykke, kan det være fordi en exoplanet i omkreds om stjernen skygger for en del stjernens lysudsendelse.

Så det er blot at finde disse karakteristiske og regelmæssige dyk - og så har man en potentiel kandidat til en exoplanet.

Det hele vanskeliggøres dog af, at en lille planet kun skygger ganske lidt, så signalerne er ikke altid så pæne og regelmæssige, som teorien beskriver. Og der kan også være andre astronomiske forklaringer på sådanne observationer, som man er nødt til at udelukke som årsag.

Når man har en kandidat til en exoplanet, forestår derfor i bedste Sherlock Holmes stil et stort arbejde med at udelukke alle andre muligheder, før man man sikkerhed kan erklære en ny exoplanet for fundet.

Christopher J. Shallue satte sig for i den tid, han råder over hos Google til at forfølge projekter af egen interesse, til at se, om man ikke kunne automatisere muligheden for at finde kandidater til exoplaneter i Keplers store data med brug af maskinlæring.

Han lavede derfor et neuralt netværk - ja faktisk lavede han flere forskelle - som ud fra sammenhængen mellem data og erklærede exoplaneter lærte sig at finde exoplaneter.

Målet er typisk, at det neurale netværk efter endt oplæring, skal identificere mindst 95 pct. af alle reelle planeter som værende planeter.

Tre forskellige netværk. Et 'convolutional' netværk er bedst, da det eksempelvis med et recall på 95 pct. (det vil identificere 95 pct. at alle reelle planeter som værende planeter) har den højeste præcision på 90 pct. (90 pct. af alle dets klassifikationer er reelle planeter) Illustration: Nasa/Google

Når programmet har lært sig det ud fra en del af datasættet, kan man teste om i en anden del af datasættet også kan finde de rigtige kandidater.

En særlig form for neuralt netværk kaldet et 'convolutional' netværk viste sig at være bedst til at finde nye planeter.

De nye exoplaneter

Med dette neurale netværk kunne man så endelig gå jagt i endnu ikke undersøgte dele af Keplers enorme data for at se, om man kunne finde exoplaneter, der ikke tidligere var opdaget.

Der blev udvalgt data fra 670 stjerner med flere en exoplanet. Det er en uhyre lille del af det samlede datasæt, da Kepler har studeret omkring 200.000 stjerner.

Her fandt man 513 nye såkaldte ‘treshold crossing events’ eller TCE, som kunne skyldes en exoplanet.

Modellen forudsagde, at 30 af disse med en sandsynlighed større end 50 pct. var forårsaget af en exoplanet. Af disse udvalgte man de 9 med en sandsynlighed større end 80 pct. til en særskilt analyse.

Efter en del benarbejde blev disse ni kandidater reduceret til tre, da man ikke kunne udelukke andre forklaringer på hændelsen end en exoplanet for de øvrige.

Og af disse tre viste sig kun to af med fuld sikkerhed at være exoplaneter, selv om Shallue og Vanderburg redegør for, at den tredje TCE også har mange indikationer på at være forårsaget af en exoplanet.

Maskinlæring har således vist sig at være en anvendelig metode til at finde nye TCE’er, som kan skyldes en exoplanet. Men det er en kæmpe opgave efterfølgende at udelukke, at andre astronomiske forhold kan have givet anledning til disse.

Eksisterende software er bedre på visse punkter

Exoplanetjægere benytte naturligvis allerede i dag software i deres analyse, som Nasa’s Robovetter. Og dette system er stadig på mange måder bedre end det nye maskinlæringsprogram.

Shallue og Vanderburg erkender derfor i konklusionen i deres videnskabelige artikel, at metoden både har sine fordele og sine klare begrænsninger. Det vil eksempelvis være helt urealistisk at bruge metoden på meget store datasæt pga. den efterfølgende omfattende analyse.

Men de bemærker også, at de har tænkt sig at forsøge at forbedre modellen for at forøge dens anvendelighed.

Så det, vi har set nu, er måske kun første skridt i retning af mere avancerede systemer til søgning efter exoplaneter. Og da vi har set, hvad kollegerne hos DeepMind har formået inden for maskinlæring med AlphaZero, så skal man ikke blive overrasket, hvis denne metode på sigt kan slå andre af banen.

Læs også: BAGGRUND: AlphaZero spiller skak på en overnaturlig måde

Her ses hvordan lysstyrken fra stjernen Kepler 90 ændres, når en planeten Kepler 90i passerer henover stjerneskiven. De grå punkter er gennemsnitsværdier over en periode på 10 minutter, mens de lilla punkter er et gennemsnit for en fjerdedel af passagetiden, som i det aktuelle tilfælde svarer til ca, 45 minutter. Omløbstiden for planeten er 14,45 dage og planetens radius er anslået til 1,32 gange Jordens. Illustration: Nasa/Google