Dansk for alle

Senest opdateret d. 11/1-2019
Alexandra Instituttet
Resultatkontrakt 2019-2020 under temaerne Informations- og Kommunikationsteknologi
Martin Møller
Deputy Director

Der er nye muligheder for automatisk håndtering af tekst til næste generation af services inden for sproget dansk. Der er dog mangel på viden og adgang til ressourcer både i form af annoterede datasæt men også i form af metoder og værktøjsbyggeklodser.

Vi ønsker at udvikle et sæt danske ressourcer til automatisk sproghåndtering. Dvs. et sæt sprogressourcer, der tillader SMV’er (og alle andre) at udnytte automatisk håndtering af det skrevne danske sprog i deres produkter og deres daglige arbejdsgange. Ressourcerne tager form af datasæt, metoder, regelsæt, værktøjer, opskrifter og tilgængelige best practices, så virksomheder nemt kan komme i gang med at bygge kunstige intelligenssystemer, der håndterer dansk tekst. Der vil være tale om et sæt af byggeklodser, der kan anvendes på tværs af forskellige virksomheder og forretningsdomæner.
I projektets løbetid vil fokus være på indsamling af komponenter, udstilling i et repositorium og basisydelser baseret på disse komponenter. Der er altså tale om en "RedHat" kommerciel model, hvor vi stiller basiskomponenter til rådighed, og hvor teknisk support og specialkomponenter kan tilkøbes på kommercielle vilkår. Vi vil demonstrere de udviklede ressourcer i cases med særligt udvalgte virksomheder og vise, hvordan man kan digitalisere og automatisere håndtering af skrevet dansk tekst ved hjælp af kunstig intelligens.
Baseret på disse ressourcer og kompetencer opbygget i denne aktivitetsplan vil Alexandra Instituttet tilbyde en række af ydelser til virksomheder, der ikke selv ønsker af opbygge kompetencer samt til virksomheder med særlig komplekse udfordringer. Der er tale om ydelser, der udbydes bredt til alle virksomheder, som arbejder med automatisering og digitalisering af dansksprogede tekster. Der er således ikke en kundegruppe segmenteret efter fag men derimod segmenteret efter behov (behovet for at kunne automatisere behandlingen af dansksprogede tekster). En lang række virksomheder har meldt sig som interessenter og som potentielle casevirksomheder. Det spænder fra virksomheder, der ønsker at automatisere dele af regnskabs- og revisionsbranchen, som f.eks. Digital Revisor, til branchenetværk som f.eks. Iværksætter Netværk (IVN) til store virksomheder som IBM, ATP og offentlige institutioner som Erhvervsstyrelsen.
Overordnede aktiviteter
• Viden om bedste basisressourcer til moderne sproghåndtering, specifikt for dansk
• Opbygning af sprogspecifikke basisressourcer (datasæt, metoder, løsningsbeskrivelser, opskrifter og best practice beskrivelser. Regelsæt, værktøjskasse, anvendelse af Big Data og særligt deep learning teknologier til sproghåndtering).
• Kompetencer omkring håndtering af gængse udfordringer på sprogområdet. Som for eksempel, sentimentanalyse, intentionsanalyse af dialoger, generering af svar i Q&A systemer samt ikke mindst beskyttelse af personfølsomme oplysninger i tekstbaserede systemer.
Dansk for alle vil udstille et online tilgængeligt repositorium af komponenter, som alle virksomheder kan benytte til automatisk håndtering af sprog. Målet er, at mange af de tilgængelige komponenter skal være open source/åben adgang, som alle mere eller mindre bare kan tilgå og benytte. Alexandra Instituttet vil så udvikle en række af kommercielle services og produkter oven på de åbne komponenter.

Budget:
2019: 2.400.000 kr.
2020: 2.400.000 kr.

Baseret på aktivitetsforslag:  Dansk for alle

Nøgleord