Målet med aktiviteten er at styrke danske virksomheders muligheder for at udvikle og benytte software, der kan håndtere det danske sprog.
Målet med aktiviteten er at styrke danske virksomheders muligheder for at udvikle og benytte software, der kan håndtere det danske sprog. Både for at styrke deres konkurrenceevne, men også for at danske forbrugere og borgere kan få gavn af software, der kan forstå det danske sprog. Det kan både være en chatbot der guider en igennem et køb i en webshop eller software der kan transskribere telefonsamtaler, så det er hurtigere at lave journalisering, notater, m.v. i borgerservice.Udviklingen indenfor sprogteknologi går lynhurtigt i disse år, men mindre sprog som dansk sakker forsat bagud. Det betyder at trods den tiltagende opmærksomhed på dansk sprogteknologi de seneste år, er dansk fortsat et begrænset sprog digitalt set. Konklusionen fra den seneste rapport om Europæiske sprogressourcer er meget klar. Udviklingen går i positiv retning, men dansk betragtes forsat som ”fragmentarisk understøttet” og vi er i Danmark forsat et godt stykke efter de større europæiske sprog som engelsk, tysk og spansk indenfor alle sprogteknologiske områder.
Moderne sprogteknologiske løsninger baserer sig på maskinlæring og det kræver store mængder af data i høj kvalitet. Og de data mangler vi på dansk for at kunne følge med den udvikling, der sker på de større sprog. Set fra et virksomhedsperspektiv er mangel på data forsat en af de mest kritiske udfordringer. Da data er omkostningsfulde at producere, er det en så betydelig barriere, at mange virksomheder afventer at gå i gang. Der er med andre ord brug for at udvikle åbne danske datasæt, som kan bruges af alle. Åbne data vil desuden betyde at de store internationale og ofte flersprogede grundmodeller, der ofte udvikles af globale tech-virksomheder vil kunne inkludere disse data i deres træning af modeller, så de også bliver bedre til dansk (se fx Open AI’s Whisper-model).
Målet med aktiviteten er at styrke danske virksomheders muligheder for at udvikle og benytte software, der kan håndtere det danske sprog. Både for at styrke deres konkurrenceevne, men også for at danske forbrugere og borgere kan få gavn af software, der kan forstå det danske sprog. Det kan både være en chatbot der guider en igennem et køb i en webshop eller software der kan transskribere telefonsamtaler, så det er hurtigere at lave journalisering, notater, m.v. i borgerservice.Udviklingen indenfor sprogteknologi går lynhurtigt i disse år, men mindre sprog som dansk sakker forsat bagud. Det betyder at trods den tiltagende opmærksomhed på dansk sprogteknologi de seneste år, er dansk fortsat et begrænset sprog digitalt set. Konklusionen fra den seneste rapport om Europæiske sprogressourcer er meget klar. Udviklingen går i positiv retning, men dansk betragtes forsat som ”fragmentarisk understøttet” og vi er i Danmark forsat et godt stykke efter de større europæiske sprog som engelsk, tysk og spansk indenfor alle sprogteknologiske områder.
Moderne sprogteknologiske løsninger baserer sig på maskinlæring og det kræver store mængder af data i høj kvalitet. Og de data mangler vi på dansk for at kunne følge med den udvikling, der sker på de større sprog. Set fra et virksomhedsperspektiv er mangel på data forsat en af de mest kritiske udfordringer. Da data er omkostningsfulde at producere, er det en så betydelig barriere, at mange virksomheder afventer at gå i gang. Der er med andre ord brug for at udvikle åbne danske datasæt, som kan bruges af alle. Åbne data vil desuden betyde at de store internationale og ofte flersprogede grundmodeller, der ofte udvikles af globale tech-virksomheder vil kunne inkludere disse data i deres træning af modeller, så de også bliver bedre til dansk (se fx Open AI’s Whisper-model).
Uddannelses- og Forskningsstyrelsen
Haraldsgade 53
2100 København Ø
Tlf: +45 7231 7800
ufs@ufm.dk
Gregersensvej 1
DK-2630 Taastrup
Tlf: +45 4516 2626
info@gts-net.dk
GTS Login
Log ind som GTS bruger for at administrere dine indsatsområder og aktiviteter.