Hele den danske befolkning skal på arbejde for at hjælpe forskere, når det store forskningsprojekt Lyden af Danmark sættes i gang den 24. april.
Ved hjælp af en mobiltelefon skal danskerne optage lyde, når de færdes udenfor. Det kan være på vej til arbejde, i skolegården, på skovturen eller et helt andet sted. Det er første gang nogensinde, at lydene for et helt land kortlægges.
»Vi ved helt grundlæggende ikke, hvilke lyde der omgiver os. Vi ved ikke, hvordan natur- og menneskeskabte lyde er fordelt i Danmark, og vi forstår ikke, hvordan lydene påvirker os. Det har vi brug for, at Danmarks befolkning hjælper med at afdække. Det er let at deltage – det kræver kun en mobiltelefon og 30 sekunder af din tid. Det er både sjovt, og så har det stor betydning, når vi skal tage stilling til, hvilket lydmiljø vi ønsker os i fremtiden,« siger leder af forskningsprojektet, professor Carsten Rahbek fra Center for Makroøkologi ved Københavns Universitet.
Projektet er unikt på verdensplan, da Danmark vil blive det første land i verden med et nationalt lydkort. Målet med projektet er at indhente data til en bred vifte af forskningsområder inden for både natur, sundhed og miljøøkonomi. Udover forskning er den kommende lyddatabase også interessant for den danske lydbranche, f.eks. høreapparatindustrien.
Lyden af Danmark er udviklet af Center for Makroøkologi, Evolution og Klimaet, Grundforskningscenter på Københavns Universitet i samarbejde med Institut for Matematik og Computer Science (DTU), SDU og Uddannelses- og Forskningsministeriet.
Læs også: 100.000 frivillige deltog i verdens største kvanteeksperiment
Lyd bliver ofte glemt
De seneste årtier er man begyndt at tale om en ny tidsalder i jordklodens historie: Antropocæn. Men fordi lyde er flygtige, har lyd ikke spillet nogen stor rolle i de faglige debatter om, hvad der definerer og præger den antropocæne tidsalder. Alligevel har udviklingen i lydlandskaberne afspejlet mange af de processer og udviklinger, der definerer Antropocæn.
Mennesker har eksempelvis sat spor med lyde ved skovrydning og jordbrug, og med byernes opståen kom lyden af håndværk, kommunikation og industri.
Derfor tyder meget på, at naturens lyde er blevet trængt i baggrunden. For de arter, der kommunikerer eller holder øje med rovdyr ved hjælp af hørelsen, er menneskelyde et stort problem, som kan være med til at bestemme deres udbredelse og overlevelse.
Læs også: Danske mikrofoner skal sikre lydsporet under Nasas næste Mars-landing
Kunstig intelligens skal løbes i gang
Lydene, som danskerne optager, opsamles i en database, hvor software sorterer alle lyddata.
Softwaren vil analysere lydene og med tiden lære at skelne mellem natur- og menneskeskabte lyde.
»Netværket er implementeret i Python med brug af TensorFlow-frameworket fra Google. Det er baseret på det arbejde, som er lavet af en gruppe fra Google, som har taget en VGG-model, som ellers er designet til billedgenkendelse og tilpasset den til at kigge på spektrogrammer af lyde i stedet for og på den måde få den til at klassificere lyde,« fortæller Martin Ordell Sørensen, specialkonsulent hos DTU Compute, som står for dataanalysen af de mange lydoptagelser.
Det kræver en del arbejde at håndtere optagelser fra kommercielle smartphones.
»Netværket er p.t. trænet på lidt mere 'rene' optagelser, men når man går over på en telefon, så er der nogle nye støjkilder, som man skal håndtere. Det er bl.a. vindstøj, som er en ret dominerende støjkilde på rigtigt mange udendørsoptagelser. Alt afhængigt af telefonmodel/browser så vil kvaliteten af optagelsen også variere. Der kan være forskelle i hardware, da nogle telefoner har flere mikrofoner, som bl.a. bliver brugt til støjreduktion. Dernæst kan der være algoritmer som AGC (automatic gain control), som også går ind og påvirker resultatet. Til sidst kan browseren komprimere lyden og reducere bitraten med f.eks. OPUS- eller AAC-formaterne, og det ser vi også påvirker genkendelsen,« siger Martin Ordell Sørensen.
Læs også: Opfordring fra Nasa: Hjælp os med at samle viden om solformørkelser
Softwaren er dog ikke mere intelligent, end at den gerne vil have en hjælpende hånd fra de mennesker, der har optaget lyden, især i starten, hvor datamængderne er små.
Deltagerne skal også være med til at udvikle de algoritmer, der kan kende forskel og sortere i lydene.
»Vi satser på at få 30 sekunders optagelser fra op mod 100.000 danskere. I starten er den kunstige intelligens snydedum, og derfor beder vi samtidig borgerne om at hjælpe med at beskrive, hvad det faktisk er, man kan høre på deres lydoptagelser,« siger Carsten Rahbek.
Det er blandt andet folkeskoleelever, som Carsten Rahbek håber vil bidrage til indsamlingen af lydbidder fra Danmark. Når man beder almindelige mennesker om at bidrage med forskningsdata optaget på almindelige smartphones, så vil der opstå fejl og unøjagtigheder.
» I gamle dage satsede man på at optimere kvaliteten af det enkelte datapunkt, men når vi arbejder med de store linjer, så kan vi ikke nøjes med perfekte data, for der er alle mulige lydkilder, der påvirker omgivelserne. Med store datasæt vil vi kunne sortere de fejl fra, der unægtelig vil opstå. En del af min egen forskning handler om, hvordan man kan få god information ud af 'dirty data',« fortæller Carsten Rahbek.
Selv når softwaren er blevet fodret med rigtigt mange lydoptagelser, kan det være svært at genkende og adskille lyde. Men sådan er det også for mennesker.
»Vi har en stor forventning om at netværket bliver markant bedre til at genkende lyde når det lærer at lytte gennem en mobiltelefon. Når det er sagt, så kan det faktisk være ret svært selv for et menneske at genkende lyde udelukkende ud fra en optagelse hvis man ikke også har en visuel reference med.«
Har du selv fået lyst til at bidrage med en lydoptagelse, så kan du gøre det her
Bruges til høreapparater
Det er eksempelvis beskidt data, dirty data, når 10 borgere optager en fuglelyd, og ni angiver, at der er tale om fuglesang, mens den sidste siger, at det er en gravko. Her vil algoritmerne kunne trænes til at skelne mellem, hvad der er rigtige, og hvad der er forkerte angivelser.
Fordi lyden også bliver kortlagt geografisk, kan optalgelsens position også bruges til at finde fejl. Så man kan spotte fejlen, hvis en borger angiver lyden af landbrugsmaskiner, men optagelsen stammer fra det indre København.
Ifølge Carsten Rahbek bliver kvaliteten af projektet kun bedre af, at der er stor geografisk spredning i de indsamlede data, og af, at der bliver indsamlet rigtig meget lyddata.
»Lige nu fokuserer vi de optagelser, som mennesker kan høre og opfatte. Men vi får en enorm infrastrukturdatabase, som er unik på verdensplan. Alle andre lyddatabaser er lavet ét sted på ét tidspunkt, mens vi her får et geografisk og tidsmæssig variation, som ikke eksisterer i dag. På sigt håber vi, at eksempelvis høreapparatproducenter kan udnytte lyddatabasen til at filtrere de forkerte lyde væk og fokusere på de vigtige lyde for høreapparatbrugere,« siger Carsten Rahbek.
På længere sigt vil lyddata danne grundlag for forskellige forskningsprojekter om lyd. Eksempelvis menneskets indflydelse på lydbilledet i de danske landskaber og miljøer, effekter på naturen og effekter på helbred.
Læs også: DTU-forsker har knækket koden til at fjerne støj fra genopladelige høreapparater
Borgervidenskab kortlægger fiskebestande
Lyden af Danmark er et nationalt citizen science-projekt, bedre kendt på dansk som borgervidenskab. Det er et begreb, der bruges, når mennesker, der ikke nødvendigvis besidder nogen videnskabelig uddannelse, er med i forskningsprojekter, for eksempel ved indsamling og bearbejdning af data.
I Danmark findes der flere lignende citizen science-projekter, blandt andet DTU’s Fangstjournal, hvor lystfiskere nemt kan registrere, hvad de fanger eller ikke fanger på en fisketur. De oplysninger kan forskere fra DTU Aqua bruge, når de skal kortlægge fiskebestandene i de danske farvande. I dag har fangstjournalen tæt på 10.000 brugere.
For nylig har engelske klimaforskere bedt private om hjælp til at digitalisere millioner af historiske vejrdata om temperatur og lufttryk. Målet er bedre at kunne forudsige klimaforandringer
Projektet, som går under navnet Operation Weather Rescue, er udvalgt som citizen science-projekt under British Science Week 2019 i marts i år.
Læs også: Amatører hjælper klimaforskere med digitalisering af historiske vejrdata
