Ifølge Michael Syskind Pedersen er maskinlæring og kunstig intelligens høreapparatindustriens nye schweizerkniv.
Med en ph.d. i signalbehandling, 20 års anciennitet og 90 patentansøgninger på cv’et er han som senior principal digital signal processing engineer en af de centrale personer i Oticons arbejde med at optimere høreapparater gennem maskinlæring.
Konkret forbedrer Oticon f.eks. et høreapparats støjreduktion, både den generelle og den direktionelle (beamforming), ved at udskifte dele af signalprocesseringen med neurale netværk.
Masser af data
Maskinlæringen efterligner menneskers måde at lære på. Man lærer baseret på eksempler, dvs. data. For at lære sit modersmål skal et barn f.eks. eksponeres for mere end 40 mio. ord i de fire første leveår. Desuden lærer man af fejl. Man prøver sig frem, begår fejl og lærer af dem. En maskinlæringsmodel lærer også gennem eksempler og af sine fejl, men langt hurtigere end vi mennesker.
Bl.a. derfor er man i mange brancher fascineret af potentialet i maskinlæring og kunstig intelligens. Ofte viser det sig imidlertid, at man ikke har tilstrækkelig med højkvalitetsdata at træne systemerne på. Det problem har høreapparatindustrien ikke.
»Inden for audioverdenen har vi masser af data. Desuden ved vi allerede rigtig meget om, hvordan man konstruerer et effektivt høreapparat, og vi er allerede nu kommet rigtig langt med traditionelle antagelser om, hvordan man f.eks. fjerner baggrundsstøj. Det betyder, at vi har gode forudsætninger for at anvende store datamængder til maskinlæring.«
Illustration: Jeppe Carlsen.
Godt input er vigtigt
Til gengæld er man begrænset af andre parametre end mængden af data. Eksempelvis et begrænset strømforbrug, der skal anvendes fornuftigt, da apparatets batteri skal kunne holde til brug gennem alle døgnets vågne timer.
Det dilemma håndterer man ifølge Michael Syskind Pedersen bl.a. ved at fodre maskinlæringens sorte boks med højkvalitet data. Desuden handler det om, at man udtrækker karakteristikker (features), der er vigtige for at kunne skelne data fra hinanden.
»Disse features giver man til sin maskinlæringsalgoritme, som forhåbentlig baseret på nok eksempler giver det ønskede output. Helt præcis hvordan hver enkelt parameter inde i algoritmen indstiller sig, og hvad betydning den enkelte parameter har, er svært at vide. Derfor ser man lidt ind i en »sort boks«. Det er sådan, jeg ser maskinlæring. Man ved ikke nødvendigvis, præcis hvordan den kommer fra A til B. I stedet kigger man på input og output og sikrer sig, at den sorte boks får input af høj kvalitet og leverer det output, man ønsker.«
F.eks. ved man, at vi lytter i frekvenser, og at vi har bedre opløsning i lave frekvenser end i høje. Det betyder, at man kan nøjes med at fodre algoritmen med en frekvensrepræsentation af audiosignalet i stedet for at føde det komplette mikrofonsignal ind i systemet. Ved at fodre sin maskinlæringsalgoritme med gode features kan man spare beregninger. Det er vigtigt, fordi et høreapparat kun har begrænsede beregningsressourcer til rådighed.
I maj 2022 kårede Ingeniøren for syvende år i træk Oticon som den mest populære arbejdsplads i kategorien Elektronik & Telecom.
På tværs af frekvenser
Han nævner støjreduktion som eksempel. Kunstig intelligens er bedre og ikke mindst hurtigere til at træffe komplekse beslutninger, eksempelvis på tværs af frekvenser, end en ingeniør vil være til at finde de samme indstillinger. Tidligere skruede man på nogle parametre, lyttede, skruede, lyttede og så fremdeles.
Lytte gør man stadig. Man foretager altid en grundig, menneskelig evaluering, inden et produkt eller en ny feature sendes på gaden. Men forinden får man hjælp fra en maskinlæringsalgoritme til at finde de mest optimale indstillinger. Det handler i høj grad om at definere, hvad man gerne vil have, og så få en maskine til at vise vejen derhen, forklarer Michael Syskind Pedersen.
»F.eks. har vi nogle gode modeller til at estimere taleforståelighed, dvs. hvor meget støj man som bruger kan tolerere og stadig forstå det, der bliver sagt. Når man er hørehæmmet, er øret lidt ligesom en flaskehals. Det er begrænset, hvor meget lyd der kan komme gennem øret og blive processeret af hjernen. Hvis man prøver at få al lyden gennem øret, bliver det hele mudret sammen. Derfor bliver man nogle gange nødt til at vælge noget lyd fra, sådan at man til gengæld er i stand til at håndtere den resterende lyd.«
»I sidste ende er der to ting, vi gerne vil som udviklere: at blive bedre til at hjælpe brugeren med at høre og at finde ud af, hvad det faktisk er, man i en given situation gerne vil lytte til, og at dæmpe lige præcis det, der ikke er vigtigt, for til gengæld at være i stand til at kunne håndtere resten. Det er der, vi vil hen.«
Oticon har en række åbne stillinger inden for DSP og softwareudvikling.
Kraftig medicin
»Vi er blevet rigtig dygtige til at reducere støj. Man kan sige, at vi har en kraftig medicin. Nu skal vi bare blive bedre til at afgøre, hvornår den skal doseres. Det er den store udfordring. Vi nærmer os en løsning med små skridt, og maskinlæring vil helt sikkert være en del af løsningen. Vi kan fodre den med eksempler på, hvad brugerne gerne vil lytte til eller ikke har lyst til at lytte til i forskellige situationer. Derefter kan den hjælpe høreapparatet med at vælge rigtigt i en given situation.«
Ifølge Michael Syskind Pedersen vil maskinlæring formentlig finde anvendelse på de fleste områder inden for udviklingen af høreapparater. Netop fordi den lærer ligesom mennesker: baseret på eksempler og ved at begå fejl – bare hurtigere.
