Udvalgsrapport om sprogteknologi og kunstig intelligens for dansk
I begyndelsen af 2018 nedsatte kulturministeren et sprogteknologisk udvalg under Dansk Sprognævn. Udvalgsarbejdet blev afsluttet i april 2019, og her kan du læse om udvalgets rapport, konklusioner og forslag.
Udvalget har i løbet af 2018 inddraget mere end 120 offentlige og private institutioner og virksomheder i en række workshops og seminarer for at afdække behovet og afsøge mulighederne for at understøtte brugen af dansk i forbindelse med kunstig intelligens. Resultaterne blev den 25.4.2019 præsenteret i rapporten Dansk Sprogteknologi i Verdensklasse.
En stor del af vores viden er formuleret på et sprog, og størstedelen af den viden vi har om Danmark, om danske forhold og om hinanden, er naturligvis formuleret på dansk.
Sprogdata udfordrer computere
Kunstig intelligens er typisk baseret på analyser af store datamængder. Det giver gode og lettilgængelige resultater når disse data er tal, men det er en langt større udfordring når data består af sprog i form af tale og tekst.
Tal er entydige og svarer til den måde computerne er indrettet på. Sprog er mangetydigt og langt mere komplekst fordi det er en del af vores eksistens og tæt sammenvævet med vores viden om verden, den måde vores samfund er opbygget på, og med den kultur vi er opvokset i.
Langt de fleste systemer som har en sproglig kapacitet der er baseret på kunstig intelligens, er udviklet på basis af data fra andre sprog, først og fremmest engelsk. De afspejler derfor en forestilling om en verden, et samfund og en kultur som ikke stemmer overens med vores. Derfor skal systemer som bruger kunstig intelligens, udvikles på basis af danske sprogdata for at kunne fungere optimalt og gøre nytte i vores samfund.
Sprogteknologi der kan dansk
Det at udvikle chatrobotter, taleassistenter, tekstanalysesystemer, automatisk oversættelse m.m. med høj sproglig kvalitet for dansk er en enorm udfordring for de globale og lokale virksomheder. De investeringer som skal til, er for høje i forhold til den indtjening man kan forvente i det danske sprogområde, og det modvirker udviklingen af sprogteknologi for dansk i et sundt og konkurrencedygtigt marked.
Investeringer, værktøjer, uddannelse og forskning
Der er brug for offentlige investeringer i åbne sprogresurser, dvs. frit tilgængelige sproglige datasamlinger, og bedre værktøjer til dansk sprogforståelse (tale og tekst) for at det danske samfund kan få udbytte af den nye teknologi. Samtidig bør der investeres mere i uddannelse og forskning i dansk sprogteknologi for at dansk også kan være med i fremtidens systemer.
Udvalget foreslår derfor:
- At der oprettes en organisation som har til opgave at koordinere indsatsen for dansk sprogteknologi
- At der oprettes en dansk sprogbank som skal understøtte udviklingen og vedligeholdelsen af danske produkter baseret på sprogteknologi og kunstig intelligens, bl.a. ved at gøre danske sprogresurser og sprogværktøjer frit tilgængelige; også en dansk termbank skal gøres frit tilgængelig
- At uddannelse i dansk sprogteknologi prioriteres
- At forskning i dansk sprogteknologi styrkes.
Udvalget foreslår endvidere at offentlige institutioner får mere fokus på at de ved at stille sproglige data til rådighed kan være med til at sikre brugen af dansk på alle samfundsområder.
Læs mere om sprogteknologiudvalgets arbejde og rapportens anbefalinger på www.sprogtek2018.dk.