Se Alexa non parla il dialetto: IA e diversità linguistica, le sfide aperte
Se l’intelligenza artificiale è destinata a diventare sempre più pervasiva nella nostra vita quotidiana, come impatterà sulla diversità linguistica? In questo contributo Birgit Alber, docente di Linguistica Tedesca, Libera Università di Bolzano e Joachim Kokkelmans, ricercatore Linguistica Tedesca, Libera Università di Bolzano, si interrogano su un tema ancora poco considerato nel dibattito sull’IA.
Nel grande dibattito sull’intelligenza artificiale – fra analisi sulle trasformazioni che introdurrà nelle nostre vite quotidiane e legittimi interrogativi sulle implicazioni etiche – c’è un tema che forse è rimasto un po’ fuori dai radar. In che modo l’IA – e la diffusione crescente di dispositivi basati su tecnologie di questo tipo – impatta e impatterà sulla diversità linguistica? Lo scorso ottobre, in occasione dell’evento VinKiamo Südtirol che ha coinvolto nel campus di Bressanone le scuole secondarie nell’ambito del progetto AlpiLinK – Lingue Alpine in Contatto, abbiamo fatto un piccolo esperimento: assieme agli studenti e studentesse abbiamo testato alcuni assistenti vocali e applicazioni basati sulla generative IA.
Ecco che interrogando uno dei più diffusi assistenti in ladino gardenese, abbiamo ricevuto una risposta, senza rapporto con la domanda, in albanese. Ma anche con gli altri dispositivi non è andata molto meglio, le risposte sono state parziali. Le applicazioni basate sull’IA non sono allenate a riconoscere varietà linguistiche minoritarie oppure dialetti perché le basi di dati, orali o scritte, a cui possono accedere, non sono sufficienti.
Birgit Alber, docente di Linguistica Tedesca, Libera Università di Bolzano
Meta – il colosso del big tech che controlla fra l’altro Facebook, Instagram, e WhatsApp – sta sviluppando un sistema di traduzione per le lingue non scritte che rappresentano una quota ancora significativa delle lingue del mondo: i primi test sono stati sviluppati con l’Hokkien, lingua parlata a Taiwan da milioni di persone. Diverso il caso delle varietà linguistiche minoritarie, in cui le banche dati – orali e scritte – disponibili con cui allenare gli algoritmi basati sull’IA, che richiedono grandi quantità di dati, sono ancora limitate. Con il progetto AlpiLinK stiamo costruendo il più grande database italiano dedicato alle varietà linguistiche minoritarie implementato in modalità crowdsourcing e aperto alla partecipazione di tutti i cittadini, ma in ogni caso la strada da percorrere appare ancora molto lunga e riesce difficile immaginare di poter arrivare a raccogliere un corpus così ampio da soddisfare questa esigenza.
Un tema che apre nuovi interrogativi per il momento senza risposta: se l’IA è destinata a diventare sempre più pervasiva, come fare in modo che questa diffusione non comprometta la diversità linguistica? Gli assistenti vocali sono dispositivi spesso impiegati all’interno delle mura domestiche, ambito privilegiato per quanto riguarda l’uso del dialetto: per interrogare questi strumenti, è invece necessario “cambiare” il proprio linguaggio. Non solo: ci sono varietà linguistiche, pensiamo ad esempio ai dialetti tirolesi nel nostro territorio, il cui uso non è limitato ai contesti informali, ma è esteso anche a molti ambiti formali, per esempio alle riunioni di lavoro. Anche in questo caso si pone una questione di accessibilità alle tecnologie. Il fatto che non sia possibile utilizzare i sempre più avanzati tool IA che registrano i meeting per restituire poi un report dettagliato rappresenta senz’altro un limite, e rischia di “imporre” un cambiamento nella scelta dell’uso della lingua. Progetti come AlpiLinK possono rappresentare un primo passo verso l’integrazione delle lingue minoritarie nelle nuove tecnologie.
Birgit Alber, docente di Linguistica Tedesca, Libera Università di Bolzano e
Joachim Kokkelmans, ricercatore Linguistica Tedesca, Libera Università di Bolzano
Immagine in apertura: un dispositivo Alexa Foto di Finn da Pixabay