TALEGJENKJENNING PÅ NORSKSpråkteknologi kan spare to milliarder trygdekroner

Ufør: Mosken Bergh får sterke smerter av å sitte og må kommunisere med omverdenen ved hjelp av talegjenkjenningsprogramvare på engelsk. - Folk lurer ofte på hvorfor jeg svarer på engelsk når de spør på norsk, sier hun. Foto: Eirik Helland Urke
Ufør: Mosken Bergh får sterke smerter av å sitte og må kommunisere med omverdenen ved hjelp av talegjenkjenningsprogramvare på engelsk. - Folk lurer ofte på hvorfor jeg svarer på engelsk når de spør på norsk, sier hun. Foto: Eirik Helland Urke
Artikkelen fortsetter under annonsen

Men Arbeidsdepartementet vil ikke betale prislappen på 13 millioner.

Denne artikkelen er over ett år gammel og kan innholde utdatert informasjon

Artikkelen fortsetter under annonsen

Wake up. Open microsoft outlook. Create new email. Andreas. Press enter. Subject.

Mosken Bergh ligger i sengen og snakker til pc-en gjennom et headset med mikrofon. Med stemmen åpner hun nettleser, Microsoft outlook, forfatter en e-post og sender den til sønnen.

Flere ganger i døgnet er hun innom sitt eget nettforum for folk med kroniske smerter, som hun redigerer via talen, på engelsk.

Les også: Nav brøt reglene ved kjempeanbud

Innsamlet materiale

Den sengeliggende, uføre juristen er en av fem superbrukere som i flere år har brukt det amerikanske talegjegjenkjenningsprogrammet Dragon naturally speaking (DNS).

Dataprogrammet lar henne kommunisere og leve et aktivt liv på internett. Eneste, men ikke ubetydelige hake, er at det sosiale livet må foregå på engelsk.

– Det er uforståelig. Jeg skjønner ikke hvordan regjeringen på den ene siden sier det er altfor mange uføre og at flere må ut i arbeid, og samtidig nekte å bidra til å etablere talegjenkjenning på norsk. Det henger ikke på greip.

Artikkelen fortsetter under annonsen
Artikkelen fortsetter under annonsen

Bergh sikter til at Nuance, et av verdens ledende selskap innen taleteknologi, som i dag tilbyr talegjenkjenning på åtte språk, har sagt seg villig til å utvikle en skandinavisk oversettelse ved hjelp av språkmateriale tidligere innsamlet i Norge.

Prisen er beregnet til 13 millioner norske kroner. En sum Arbeidsdepartementet ikke vil betale.

Les også: Snart kan du trene fra lenestolen

Artikkelen fortsetter under annonsen
Artikkelen fortsetter under annonsen

- Udemokratisk: - Index. Scroll down. Who is online? Mosken Bergh (57) betjener den engelske delen av sitt nettforum for folk med kroniske smerter ved hjelp av talen. - Mange norske uføre ønsker å delta i helsedebatten, men klarer det ikke, sier Bergh. Vakthunden Teddy viker sjelfen fra Berghs side hjemme i huset i Lommedalen. Foto: Eirik Helland Urke

Les også: Dette har dere krav på fra NAV

Satsingen havarerte

Året er 2003. Innbyggerne i Voss konstaterer at drømmen om hundrevis av it-arbeidsplasser i bygda er tapt.

Artikkelen fortsetter under annonsen

Det var Norges største språkteknologisatsing noensinne. Etter flere runder med gjenopplivningsforsøk er konkursen til Nordisk språkteknologi (NST) et faktum.

På Voss skulle en storstilt satsing legge det teknologiske grunnlaget for utvikling av avansert nordisk taleteknologi. Endelig skulle svensker, dansker og nordmenn kunne legge seg på sengen, droppe tastaturet og snakke inn en e-post, akkurat som briter, amerikanere og tyskere hadde gjort i flere år. Uten altfor stor feilmargin.

Målgruppen var formidabel. Advokater, studenter, funksjonshemmede, eller folk som bare ville gjøre ting litt mer effektivt.

Konkursen til NST-medeier Lernout & Hauspie var starten på nedturen for NST. Det belgiske selskapet ble veltet overende etter kreativ regnskapsføring i beste Finance Credit-stil.

I løpet av om lag seks års drift, fra oppstart i 1997 til konkursen i 2003, hadde NST på Voss svidd av over 200 millioner kroner.

Artikkelen fortsetter under annonsen
Artikkelen fortsetter under annonsen

Les også: Åpner for å passe på demente med GPS

Intelligent programvare: Når du starter å bruke Dragon naturally speaking (DNS) leser du inn en tekst som lærer talegjenkjenningsprogrammet hvordan du uttaler ulike ord. DNS lærer underveis som du bruker programmet, og kan også lære av hvordan du formulerer deg i e-postene i innboksen din.

Språkarv

Tilbake lå enorme mengder innsamlet materiale om det nordiske språk: 6000 stemmeprøver fra over 3000 personer.

Stemmeopptak fordelt på 11 norske, ti svenske og åtte danske dialekter, tatt opp gjennom både mobiltelefon, telefon og mikrofon for å sikre hele spekteret fra god til dårlig kvalitet på talegjengivelsen.

Stemmeprøvene er splittet opp i sine minste bestanddeler, og sammen med registrering av alle mulige lydoverganger, er disse lagret i et enormt «fonembibliotek».

Artikkelen fortsetter under annonsen

Etter konkursen ble den lingvistiske databasen etter hvert tatt over av et interimstyre, eiet av Universitetet i Oslo, Universitetet i Bergen, NTNU, Språkrådet og IBM. Senere ble eierskapet til språkmaterialet overdratt til Nasjonalbiblioteket for forvaltning og videreutvikling.

I praksis ligger nå den norske språkarven fra Nordisk språkteknologi fritt tilgjengelig på internett via Språkbanken. Til fri benyttelse for selskap som utvikler taleteknologi, forskere, språkvitere og offentlige virksomheter som utvikler elektroniske løsninger for offentlige tjenester.

Artikkelen fortsetter under annonsen

Superbrukere testet

Nav Kompetansesenter for tilrettelegging og deltakelse har i årevis sett et stort behov for talegjenkjenningsteknologi til svært mange ulike grupper av uføre og sykmeldte, med alt fra alvorlige nevrologiske lidelser og dysleksi til såkalt musearm.

Artikkelen fortsetter under annonsen

I 2011 bevilget Nav 200 000 kroner til et forprosjekt for å se om det var mulig heller å realisere talegjenkjenning på norsk gjennom eksisterende teknologi. En gruppe med fem superbrukere ble etablert.

– Tilbakemeldingen fra brukerne er svært positiv. Programvaren til Dragon naturally speaking er robust og tilrettelagt for målgruppen til å fungere effektivt i en arbeidssituasjon. Brukerne mener det ikke lenger står på teknologien, men språket, forteller ingeniør Daniel Scheidegger i Nav, som i en årrekke har jobbet med å finne teknologi som kan hjelpe funksjonshemmede å fungere i hverdagen.

Scheidegger kontaktet det norske selskapet Infoshare Solutions AS, som har agenturet for Nuance i Norge, og ba dem undersøke muligheten for å få Dragon naturally speaking på norsk.

Infoshare hadde allerede gjort undersøkelser, og mente det norske markedet kunne være like stort som det tyske. Infoshare ventet likevel at jobben ville bli krevende.

Artikkelen fortsetter under annonsen

Les også: Snart kan du få sprøytestikk uten smerter

Norge – et nobody

– Isolert sett er Norge et «nobody» for Nuance, markedet er for lite. Vi var også usikre på om hvorvidt lydfilene og dokumentasjonen på filene fra tidlig 2000-tallet var av god nok kvalitet, forteller Bengt-Jarle Kjellså.

Artikkelen fortsetter under annonsen

Infoshare hadde imidlertid nettopp formidlet salg av 4000 lisenser for pdf-konvertere til et stort industrikonsern i Norge, og hadde gjort inntrykk hos Nuance.

I tillegg kom Kjelså over en god nyhet: Nuance, som på midten av 2000-tallet kjøpte opp flere konkurrerende bedrifter, hadde også kjøpt Lernout & Hauspie, som i sin tid førte til konkursen på Voss.

– Det ga oss et håp om at datamaterialet var spilt inn på en måte som gjorde det enkelt for Lernout & Hauspie å benytte, og dermed også Nuance. Vi sendte over datamaterialet med kurer til USA. Noen måneder senere fikk vi svar: Materialet var ikke helt komplett, men de kunne bruke det, og enda bedre, de var interessert i å gjøre jobben, forteller Kjellså.

Artikkelen fortsetter under annonsen

Uføre i arbeid: Nav-reformen skulle få flere uføre ut i arbeid. - Talegjenkjenning på norsk er en av de viktigste rikkene for å få funksjonshemmede som ikke kan bruke tastatur og mus ut i arbeid, sier Daniel Scheidegger ved Nav Kompetansesenter for tilrettelegging og deltagelse. Foto: Jannicke Nilsen

Egenandel

Amerikanerne setter imidlertid betingelser. Oversettelsen må være på norsk, dansk og svensk. En ren norsk utgave av «Dragon» vil ha et for lite marked.

Et annet krav er at en del av utviklingskostnadene, beregnet til 13 millioner norske kroner, må dekkes av det offentlige. Nuance har ikke opplyst hva deres egen andel er, men forventer å dekke inn noe av det gjennom framtidig salg.

Artikkelen fortsetter under annonsen

– Det meste av jobben er gjort, men noen flere talekorpus må leses inn. Det viktigste er at de faktisk kan bruke det norske materialet, for det er langt dyrere å lage talemotoren fra bunnen av. Og når oversettelsen først er på plass, forplikter Nuance seg til å utvikle produktet videre og lansere nye, oppdaterte versjoner, sier Kjellså.

Artikkelen fortsetter under annonsen

Les også: Slik vil ny teknologi forandre helsevesenet

«Ikke kommersiell aktør»

Der stopper imidlertid medgangen for Nav. De har ikke mandat til å bevilge de 13 millionene over eget budsjett.

Nav kan kort fortalt kjøpe, men ikke utvikle ny teknologi. Hos Arbeidsdepartementet og Innovasjon Norge er det heller ingen positive signaler.

– Arbeids- og velferdsetaten er ikke en kommersiell aktør eller utvikler av nye teknologiske eller tekniske løsninger som skal selges og kjøpes i et marked, men etaten er en potensiell kunde når produktet er utviklet, svarte arbeidsminister Anniken Huitfeldt 4. februar i år, på spørsmål fra stortingsrepresentant Sylvi Graham (H) om når talegjenkjenning kommer på norsk.

Huitfeldt avslutter med at det er uklart når en «eventuell norsk versjon» av et talegjenkjenningsprogram vil komme på markedet.

Artikkelen fortsetter under annonsen

Kvalifiserer ikke for støtte

– Min påstand er at det vil være lettere å få 100 millioner kroner i støtte fra Innovasjon Norge til utvikling av ny, risikofylt norsk teknologi, enn 13 millioner kroner til å fullføre talegjenkjenning på norsk gjennom et amerikansk firma, sier Scheidegger.

Artikkelen fortsetter under annonsen

Det frustrerer brukerne som har sett hva DNS-programvaren på engelsk kan tilføre tilværelsen.

– I sju år lå jeg på magen og arbeidet. Så sviktet nakken på grunn av belastningen, og jeg måtte ligge på ryggen med tastaturet på fanget. Etter en stund ble armene betent, og nå er jeg fullstendig avhengig av Dragen, som jeg kaller den, for å kommunisere elektronisk, forteller Mosken Bergh.

Les også: Sjekk fremtidens behandlinger på sykehuset

I målgruppen: Titusenvis av arbeidssøkende funksjonshemmede er potensielle brukere av talegjenkjenning på norsk. Potensielle brukere finnes innenfor grupper med sykdommer i nervesystemet, i øyet, muskel- og skjelettsystemet, bindevevet, medfødte misdannelser, skader og personer med lese- og skrivevansker. Foto: iStockphoto/Lina Merit Jacobsen

Artikkelen fortsetter under annonsen

Må ligge

Felles for superbrukerne av DNS-programvaren, er at de på en eller annen måte ikke kan bruke vanlig tastatur.

Bergh har en kronisk inflammatorisk muskelsykdom som gjør det smertefullt å sitte oppreist. I tillegg gjør kroniske betennelser i armene det vanskelig å bevege fingrene over tastaturet.

Nav har gjennom forprosjektet identifisert grupper som kan være utestengt fra jobb, eller stå i fare for å falle utenfor arbeidslivet fordi de i perioder eller permanent ikke kan skrive på tastatur.

Beregningene er vanskelige fordi funksjonsproblemer ofte er sammensatt, og enkel teknologisk tilrettelegging ofte ikke er nok til å holde en funksjonshemmet i jobb. Økonomiske beregninger av sykefravær er heller ikke rett fram.

Artikkelen fortsetter under annonsen

Likevel viser forsiktige, nøkterne anslag enormt potensial for samfunnsøkonomiske besparelser, dersom talegjenkjenningsteknologi blir etablert på norsk, ifølge rapporten.

Artikkelen fortsetter under annonsen

To milliarder NAV-kroner

Snaut 50 000 personer var i 2009 uføretrygdede innen aktuelle diagnoser, som for eksempel sykdommer i øyet, muskel- og skjelettsystemet og nervesystemet.

Dersom bare 10 prosent av disse personene kunne brukt talegjenkjenning til å delta i arbeidslivet, kunne det betydd en besparelse på over 1,1 milliard i året.

I sykefraværsstatistikken for 2010 var det 13 927 tapte årsverk innenfor 11 identifiserte, aktuelle diagnoser. De aller fleste innenfor muskel- og skjelettgruppen. Totaltapet er beregnet til 9,4 milliarder kroner.

«Om talegjenkjenning på norsk kunne hindret bare 10 prosent av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner kroner», heter det i rapporten.

Slår man sammen potensialet innenfor uføretrygdede og sykemeldte, blir det over to milliarder kroner i sparte Nav-utbetalinger – hvert år.

Artikkelen fortsetter under annonsen

50–60 personer

– Dette er så høye tall, at det kan være vanskelig å ta det inn over seg. Men la oss snu på det. En investering på 13 millioner kroner vil være tjent inn dersom bare 50-60 personer kan bruke talegjenkjenning i arbeidslivet i ett år, sier Scheidegger.

En av regjeringens fanesaker er et inkluderende arbeidsliv. Scheidegger mener talegjenkjenning på norsk er en av de viktigste brikkene i å få funksjonshemmede som ikke kan bruke tastatur og mus ut i arbeid.

– Dette er helt avgjørende i et samfunn som har gjort seg avhengig av datamaskinen både i yrkeslivet og den private arena, sier Scheidegger.

Teknisk Ukeblad har bedt om intervju med arbeidsminister Anniken Huitfeldt.

Les også:

Slik ser influensa ut

Analyserer blodprøver på få minutter

Denne geléen skal lege dine sår