Få de daglige nyheder fra Version2 og Ingeniøren. Læs mere om nyhedsbrevene her.

close
Ved at tilmelde dig accepterer du vores Brugerbetingelser, og du accepterer, at Teknologiens Mediehus og IDA-gruppen lejlighedsvis kan kontakte dig om arrangementer, analyser, nyheder, job og tilbud m.m. via telefon og e-mail. I nyhedsbreve, e-mails fra Teknologiens Mediehus kan der forefindes markedsføring fra samarbejdspartnere.
ingternt blog

Lyt til en artikel fra ing

Tilgængelighed. Det er ikke blot et mantra for interaktionsdesignere og informationsarkitekter. Det er også et politisk krav i den nye public service aftale, at DR skal gøre alt licensfinansieret indhold tilgængeligt for især syns- og hørehæmmede. Og fra EUs side bliver alle offentlige organer nu mødt med en række nye krav om tilgængelighed på websteder og mobilapplikationer.

Stemmekapløb

Den øgede efterspørgsel efter syntetiske stemmer, der kan læse op på alverdens sprog har skabt et stemmekapløb mellem Google og Amazon, der i disse måneder forbedrer udtalen med rivende fart. Det har vi kunnet opleve på redaktionen alene indenfor den sidste måned, hvor vi har leget med Googles Text-to-Speech og Amazons Poly. Kvaliteten af udtalen er øget markant, mens der er kommet mere varme og naturlig frasering i stemmerne. Det er dog fortsat lidt komisk, når maskinen skal forbi danske ord med mange, lange vokaler og bløde d’er. Derfor har det været nødvendigt at hygge-kode med SSML (Speech Synthesis Markup Language) for at få den sidste “danskificering” på plads. Der er dog et stykke vej endnu.

Det er bare noget vi leger

Det vil vi i denne uge gerne give et dagligt eksempel på. Vi tager som et forsøg en daglig artikel og koder lidt på sprogtonen. Vi har valgt Googles stemme-tilbud, fordi det ved vores sammenligning gav det bedste resultat. Helt subjektivt. Banalt set kunne Google ved vores test eksempelvis genkende engelske ord i modsætning til Amazon Poly, der gentagne gange smed dansk udtale på alle ord. Og så bliver det nemt en fjollet omgang på et fagmedie som vores.

Hør det første resultat HER i artiklen om DTU, der vil lave øl af ris fra sushi (og det er ikke aprilsnar)

Prøv at høre forskellen

For at du kan høre forskellen har vi taget en tidligere artikel og kørt den gennem begge it-giganters tekst-til-tale. Hør dem både med og uden SSML. Det giver det mest ærlige indtryk af, hvor udfordringer i syntetisk tale endnu ligger. Og lyt meget gerne artiklerne på ing i den kommende. I ugens podcast Transformator inviterer vi så it chef hos Teknologiens Mediehus, Lars Emil Christensen, i studiet for at høre hans erfaringer med at få ordentlig digital lyd ud af vores tekster. Så må tiden vise, hvornår maskinen uden håndkodet SSML kan lave en oplæsning, vi kan stå ved og forhåbentlig give brugerne med på rejsen.

Lyt og kommenter: Hvem lyder bedst?

Emner : Lyd
Henrik Heide, redaktionschef
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Hej Henrik,

Spændende initiativ.

Bruger i de syntetiske værktøjer - fra Google eller Amazon - pga. det tekniske aspekt forbundet hermed? Eller for at spare ressourcer, som indtale fra en "rigtig" person ville kræve?

I Weekendavisens Lydavis har journalisterne selv eller andre "rigtige" stemmer indtalt artiklerne. Og selvom man sagtens forstår den syntetiske indtalelse af jeres artikel, lyder det stadig markant bedre med "rigtig" indtalelse.

Mvh Jakob

  • 1
  • 0

Hej Jakob
Det direkte svar er - ressourcer. Naturligvis eksisterer de tekniske aspekter, hvor vi som fagmedie ikke kan undgå at lade os fascinere. Vi kan nok ikke helt holde fingrene væk, når teknologien åbner nye muligheder.
Men altså. Hvis jeg havde haft råd til at få indlæst alle vores artikler, ville jeg ikke tøve med at få det gjort. Og jeg ville smide dem ud som podcast. Jeg ville give brugerne mulighed for at abonnere på stofområder, hvor filtrene kunne hedde byggeri, forskning, transport, rumfart osv. Og nu vi er ved det, så ville det være sejt at kunne tilbyde brugerne de oplæste artikler til personlige assistenter. For lytning foregår jo primært væk fra skærmen under kørsel, havearbejde og madlavning. Men det varer jo nok lidt endnu.
Både Week-end avisen og Zetland har et godt tilbud med ægte stemmer. Og det lyder meget, meget bedre.
Det er stadig anstrengende at lytte i længere tid til syntetiske stemmer, uagtet de er nået langt i udviklingen. Så det varer nok lidt endnu, inden vi tilbyder det som fast element på sitet.
mvh Henrik Heide

  • 2
  • 1

Hej Henrik,

Tak for det gode svar.

For lytning foregår jo primært væk fra skærmen under kørsel, havearbejde og madlavning.

Dette er centralt, og de, der tilbyder det meste og det bedste her, kan vinde kunder og brugere i de kommende år.

Der er så vanvittigt meget at læse - i aviser og på nettet - men ulempen ved læsning er, at man i store træk ikke kan lave andet, mens man gør det. Omvendt kan lytning, præcis som du beskriver, foregå mens man laver andre ting, og mens man er på farten. Læsning kan også foregå under visse former for transport, f.eks. når man kører i bus og tog eller ude at flyve. Men lytningen slår alligevel læsning, hvad angår fleksibilitet, fordi man kan lytte mens man går, mens man står, og mens man sidder, dvs. lytning kan fortsætte uafbrudt i eksempelvis overgangen mellem at gå og at køre i bus eller tog.

Så måske kan man sige, at det ville være en god investering at have "rigtig" indtalelse af artikler for at være sikker på, at man fremover har ressourcer til at kunne skrive - hvad siden (også) skal indtales:-)

Mvh Jakob

  • 1
  • 0
Bidrag med din viden – log ind og deltag i debatten