La IA i el seu impacte en les llengües minoritàries
Els sistemes digitals que permeten això s’anomenen assistents de veu (Alexa, Siri o Google Assistant en són els més rellevants), formen part del que anomenen aplicacions d’intel·ligència artificial
El juliol del 2019 l’Àlex Hinojo, conegut activista cultural català, feia una proclama que aviat es viralitzaria: volia poder parlar en català a la torradora i, per extensió, a qualsevol andròmina digital. Els sistemes digitals que permeten això s’anomenen assistents de veu (Alexa, Siri o Google Assistant en són els més rellevants), formen part del que anomenen aplicacions d’intel·ligència artificial i utilitzen el processat natural del llenguatge per generar la “màgia” de comunicar-nos per veu amb ells. Els processadors de llenguatge empren models de llenguatge grans (o LLMs en l’acrònim en anglès) que s’entrenen amb dades per a fer que les seves respostes s’assemblin a una conversa humana; el ChatGPT-3 és el més conegut actualment, però n’hi ha molts més.
Aquests models fan servir dades massives, provinents principalment d’internet i en format d’arxius multimèdia, que es processen de forma estadística i probabilística. Com més dades tinguin, millor serà el modelat i, per tant, com més base digital tingui la llengua en qüestió, més adequada serà la resposta. Així, les llengües amb menor presència relativa en el món digital, comparades amb les llengües més massives com l’anglès o el mandarí, pateixen el biaix dels grans nombres: com més continguts de cert tipus, més preferència d’ús per part dels models de llenguatge i de retruc de les empreses que els implementen, fet que genera més contingut d’aquest tipus, provocant així una espiral que es retroalimenta.
El català és una d’aquestes llengües minoritàries en l’àmbit digital, conjuntament amb l’euskera, el sard, el danès, l’eslovè, el wòlof, l’aymara o el inuktitut, i d’aquí rau la importància que a banda de promoure aspectes de regulació legal o de promoció d’ús de la llengua per part d’estats i de territoris, i que són cabdals per a mantenir-ne la bona salut, també cal que les persones que la parlem hi donem contingut i vida en les nostres interaccions digitals i en reclamem el seu ús perquè aquestes eines d’IA les tinguin en compte. Així doncs: “Assistent, digues-me la recepta de l’amanida de xicoies i del civet de porc fer, i recita’m la Màxima 12 del Manual Digest.”
*JORDI ASCENSI SALA
Andorra Recerca + Innovació*