I dette prosjektet vil Teknologirådet vurdere muligheter og utfordringer ved moderne taleteknologi, med bistand fra en bredt sammensatt ekspertgruppe. Gruppen har sitt første møte 2. juni.
– Vi ønsker å gi en oversikt over hvordan teknologien sprer og utvikler seg, og løfte sentrale spørsmål som bør vurderes politisk i en tidlig fase, sier prosjektleder Jonas Engestøl Wettre i Teknologirådet.
Ekspertgruppen:
- Torbjørn Karl Svendsen, professor ved Institutt for elektroniske systemer, NTNU
- Sjur Nørstebø Moshagen, leder for Divvun-prosjektet ved UiT – Norges arktiske universitet
- Per Erik Solberg, språkteknolog ved Språkbanken, Nasjonalbiblioteket
- Line Adde, produktsjef i Aidn AS
- Knut Kvale, seniorforsker ved Telenor Research
- Jon Atle Gulla, direktør for NorwAI og professor ved Institutt for datateknologi og informatikk ved NTNU
Taleteknologi har tatt kvantesprang
Ved hjelp av kunstig intelligens blir maskiner nå raskt bedre til å snakke, gjenkjenne og forstå menneskers talespråk. De blir også bedre på å utlede informasjon om oss basert på hvordan vi snakker – som alder, høyde og kroniske sykdommer.
Alt fra kaffemaskiner til store industrimaskiner kan kontrolleres med stemmen. Hverdagen blir enklere og samfunnet mer inkluderende, men i takt med utviklingen stiger også mengden stemmedata i omløp. Hva vi sier og hvordan, kan avsløre sensitiv informasjon om oss, som kan bli misbrukt og kommersialisert for profitt. De store teknologiselskapene investerer i dag tungt i markedet for taleteknologi.
Spesielle utfordringer for små språk
Skal taleteknologi tas i bruk i stor skala, må den forstå alle språk og la være å diskriminere. Å utvikle teknologien krever god tilgang på regnekraft og stemmedata på språket det gjelder. I dag fungerer teknologien best på engelsk og mandarin, de største språkene.
Spørsmål prosjektet vil vurdere:
- Hvordan utvikle og spre taleteknologi som forstår norske språk?
- Hvordan unngå misbruk av stemmedata hentet fra åpne kilder på nett?
- Hvordan sikre tilgang til stemmedata for utviklere, og samtidig ivareta personvernet?
- Hvordan minske energiforbruket når man trener modellene teknologien er bygd på?
Plan for prosjektet
I en første fase vil vi publisere en kortrapport om taleteknologi og stemmeanalyse. Senere i prosjektet er planen å utvide og utforske mulighetene og utfordringene som ligger i utviklingen av store språksystemer, som dataprogrammer som skriver egne tekster.