/elektronik

DR lancerer talende undertekster bygget på GPS-teknologi

Talesyntese, drevet af udviklingen inden for navigationsteknologi, er nu så god, at DR er på vej med talende undertekster til blinde og svagtseende i et separat lydspor på DR 1.

Af Jakob Møllerhøj , torsdag 22. dec 2011 kl. 07:19

Når Danmarks Radio til foråret starter de første forsøg med talende undertekster, så skyldes det i høj grad udviklingen inden for GPS-enheder. Den syntetiske stemme-navigation er nemlig blevet så god, at den også kan bruges til at læse undertekster op for blinde, svagtseende og andre, der kan have svært ved danske undertekster, fortæller seniorkonsulent ved DR Peter Mølsted.

»Det skal svare til, at der sidder en i rummet og læser underteksterne op,« siger han.

I første omgang har Danmarks Radio set sig lun på to syntetiske oplæserstemmer, en herrestemme og en damestemme. Stemmerne er genereret med software fra et firma, som Peter Mølsted ikke ønsker at oplyse navnet på, da den endelige beslutning om, hvilket firma der skal levere stemmerne endnu ikke er truffet.

Bortset fra selve talesyntesesoftwaren, så er det DR’s teknikere, der har sammensat systemet bag live-oplæsningen af undertekster. Konkret finder det sted ved, at det separate undertekstspor for DR 1 (det er i første omgang kun hovedkanalen, der får live-oplæsning) køres forbi en computer med talesyntesesoftwaren, som derefter spytter et lydspor ud, der ender på synstolkningskanalen for DR 1.

Lydsporet, der havner på kanalen, er en sammensætning af den syntetiske tale og så original lyden på udsendelsen, der automatisk bliver dæmpet de steder, hvor der er undertekster, der skal læses op.

Synstolkningskanalen er virtuel, hvilket vil sige, at den kun optræder som selvstændig kanal ude ved seerne, men fra DR’s backend bliver der kun udsendt et lydspor med synstolkning, som så smelter sammen med videofeedet for DR1 hos seerne. Dermed benytter DR kun den båndbredde, som lydsporet fylder, og altså ikke også båndbredde for et videofeed.

Også i Sverige og Finland arbejder man på højtlæsning af undertekster, det danske system er dog anderledes.

»Jeg vil mene, at vores løsning er ganske unik,« siger Peter Mølsted.

Det unikke ved den danske løsning er, at der er tale om et separat lydspor, det i realtid køres ud sammen med hovedkanalen DR 1. Og når det digitale tv-signal i Danmark 11. januar 2012 overgår til MPEG4, så giver det separate lydspor yderligere muligheder for seerne, fortæller Peter Mølsted.

Med MPEG4 er det nemlig muligt at modtage to separate lydspor på samme tv-kanal, så de seere, der har behov for tekstoplæsningen, kan vælge det særlige talesynteselydspor uden at skulle skifte tv-kanal. Til at starte med havner lydsporet dog på den virtuelle DR 1 Synstolkningskanal.

Tale langsommere end tekst
Selvom teknikken er på plads, så er der stadig et par væsentlige hurdler, der skal overstås, før de over en mio. danskere, der af den ene eller den anden grund kan have vanskeligt ved at læse DR’s undertekster, kan få glæde af live oplæsningen.

»Den helt store udfordring er, at det tager længere tid at læse højt, end det gør at læse en tekst,« fortæller Peter Mølsted.

Eftersom den syntetiske tale får sit input fra de undertekster, der normalt bliver anvendt på DR 1 for fremmedsprog, så er der risiko for, at højtlæsningen ikke er færdig, før den næste undertekst-blok tikker ind. For at imødegå den situation, arbejder DR med en model, hvor talen afspilles i højere hastighed en normal tale.

Undersøgelser har viser, at det er muligt for et trænet øre at forstå tale, der bliver afspillet med fire gange normal hastighed. Præcist hvor hurtigt talen bliver afspillet for DR 1’s vedkommende, skal opklares via fokusgrupper i det nye år, fortæller Peter Mølsted.

»Teknisk kan vi godt håndtere det, noget andet er at få et brugbart resultat,« siger han.

Ikke til nyheder
Fokusgrupperne, som bliver sammensat af blandt andet blinde og svagtseende, skal også bidrage med opklaringen af, hvilken type udsendelser, tekstoplæsningen er velegnet til.

Peter Mølsted fortæller, at teknikken både kan anvendes til eksempelvis fiktion og fakta-udsendelser. Dog vil forsøget i 2012 ikke inkludere live-tekster som hovedsageligt bruges i DR nyhedsudsendelser..

Det skyldes, at live-tekstningen foregår ord for ord, og talesyntesen vil derfor ikke lyde rigtig eller være hurtig nok,

Talende undertekster kan være til glæde for en bred skare af mennesker i Danmark, som blinde og svagtseende, ordblinde, dårlige læsere og nydanskere som en hjælp, påpeger Peter Mølsted.

»Det kan også være en god måde at lære sproget på, fordi man får læst ordene op samtidig med, at man kan se, hvordan de staves,« siger han.

Ing.dk ville gerne have bragt et par lydprøver på DR’s talesyntese, men det har desværre ikke været muligt af rettighedsmæssige årsager. Ing.dk har dog hørt prøverne, som lyder noget mere naturtro, end den hakkende stakato talesyntese gjorde for ca. 20 år siden på skribentens Amiga 500.



22. dec 2011 kl 08:55

Søren Holm

Og koblingen til GPS er .......

Jeg ved godt der bliver nævnt GPS i artiklen, men hvad er det for en udvikling inden for GPS-enheder man drager nytte af?


22. dec 2011 kl 09:12

avatar

Peter Larsen

Re: Og koblingen til GPS er .......

Jeg ved godt der bliver nævnt GPS i artiklen, men hvad er det for en udvikling inden for GPS-enheder man drager nytte af?

Det er tekst til tale, dvs. en syntetisk stemme som læser teksten højt. Den bruges i GPS, men også mange andre steder, f.eks. mobiltelefoner.

Mvh. Peter


22. dec 2011 kl 10:28

avatar

Martin Højriis Kristensen

Re: Og koblingen til GPS er .......

Det er tekst til tale, dvs. en syntetisk stemme som læser teksten højt. Den bruges i GPS, men også mange andre steder, f.eks. mobiltelefoner

Talesyntese, polymerer, halvledere, LithiumIon-batterier og GPS er alle teknologier der anvendes i såvel (avancerede) mobiltelefoner som navigationsenheder.

Når det lige er GPS og talesyntese der kædes sammen i denne artikel, så hænger det nok sammen med at almuen sætter lighedstegn mellem en navigationsenhed og GPS-teknologien.

Martin Højriis
Yngre ingeniør af den ældre skole...


22. dec 2011 kl 11:57

Jesper Barfod

Stringens efterlyses

Det er en yderst vildledende overskrift denn artiklen har fået.

Det er jo ikke GPS teknologi, der anvendes af DR, men talesyntese som er en mere end 40 år gammel teknologi, som er blevet udviklet til nær perfektion i forbindelse med navigatorer (som benytter sig af GPS) især i biler.

GPS er som bekendt et af flere (GLONASS, GALILEO) systemer, der gør det muligt at stedfæste en dertil indrettet modtager på eller over jordens overflade og som anvendes af navigatorer, men ikke i sig selv har noget med talesyntese at gøre.


22. dec 2011 kl 22:12

Jens Madsen

Generisk lydspor

Hvis filmene blev forsynet med et "generisk lydspor" der indeholder informationer, således lyden såvel kan synkroniseres med munden, som med "stemningen" (f.eks. toneleje), så vil være muligt at eftersynkronisere med alverdens sprog automatisk. Måske enda med forskellige stemmeprofiler, der minder om de originale skuespilleres.


23. dec 2011 kl 20:30

Peter Jensen

Hvordan lyder det

Nu ved jeg ikke hvordan deres lyder, og mange af os har nok en GPS (eller GPS app) med syntese, men hvis man lige står og savner "robotisk" tale så kan man jo bruge Googles translate funktion som ud over at oversætte også udtale resultatet (kræver vist flash) på http://translate.google.com/

Man kan evt bare sætte den til Danish<>Danish - hvis man ikke lige kan stave på andre sprog ;)

I øvrigt Martin, 1 point for "almuen" (Som Google oversætter til "commoners" :)


Ny i debatten? Opret en brugerkonto

  • Seneste nyt
  • Mest læste
  • Topdebat
Populært på Facebook
 

Nyhedsbrev

Tilmeld dig vores nyhedsbrev.