Il Web torna a essere una grande Babele

Tutto ciò mi sembra ridicolo… la traduzione automatica che sostituisce l’uomo e le sue conoscenze… utopia pura.

traduzioneautomatica

Internet abbatte le barriere. Internet aiuta i popoli a dialogare, non si stancano di proclamare i tecno-entusiasti. Che magari ci prendono pure, ma dimenticano un dettaglio importante. In che lingua? «Alla fine degli anni Novanta — racconta Michaël Oustinoff, docente dell’Università di Parigi III — con l’avvento del web sembrava che l’inglese fosse destinato a diventare il linguaggio di internet. A quel tempo rappresentava l’80% dei contenuti. Oggi rappresenta meno del 30% con alcune lingue in ascesa, come il cinese, che lo tallonano da vicino».

Le percentuali possono variare — alcuni studi suggeriscono un utilizzo lievemente maggiore — ma è indubbio che l’inglese online stia perdendo terreno, mentre fioriscono, assieme al mandarino, il russo e l’arabo. Invece che un medium di omogeneizzazione, il web pare favorire la diversità linguistica, tanto che alcuni studiosi, tra cui Oustinoff, parlano di «ribabelizzazione». Le ragioni di questo cambio di paradigma sono molte: dalle maggiori possibilità di accesso alla Rete in diversi Paesi in via di sviluppo, al crescere della potenza economica di nazioni come il Brasile, che si riflette sulla quantità di contenuti prodotti in portoghese. Ma c’è anche unmotivo più semplice, quasi banale: «In genere — spiega Oustinoff — si preferisce adoperare il proprio linguaggio per comunicare, ameno che non si sia costretti a fare diversamente». Questo bisogno si sta sempre più attenuando, via via che si affinano gli strumenti di traduzione automatica sul web. Non serve conoscere l’inglese, con Google Translate o Bing Translator a disposizione.

Per ora Bing o Google forniscono ancora traduzioni talvolta bizzarre o imprecise e operano su un numero relativamente limitato di linguaggi: una settantina il primo, 43 il secondo. Ma le cose cambiano velocemente. Gli «svarioni» sono molto più rari di quanto accadesse qualche anno fa, e i miglioramenti costanti. Il segreto del successo di questi programmi sta in due parole: Big Data, termine con cui si indica l’analisi di immense quantità di dati, alla ricerca di pattern ricorrenti al loro interno. Nel caso di una traduzione, ciò significa ingurgitare grandi quantità di documenti già tradotti (Google Translate si è «allenato» con quelli delle Nazioni Unite), e da quelli partire per costruire modelli probabilistici da applicare alle nuove traduzioni.

«La traduzione automatica — afferma Viktor Mayer-Schoenberger, direttore dell’Oxford Internet Institute — è migliore di quanto sia mai stata. Ma proprio perché si basa su metodi statistici, piuttosto che nell’insegnare alle macchine le regole grammaticali e il senso del linguaggio, che funzioni o meno dipende per lo più da quanti dati si possono usare per calcolare la base statistica». Soltanto colossi come Google o Microsoft sono perciò al momento in grado di proporla con esisti soddisfacenti.

Non solo, ma questo genere di approccio soffre anche di limiti. «Il metodo statistico — afferma Michael Cronin, professore alla City University di Dublino e autore di Translation in the Digital Age — è un grande passo avanti: la sola difficoltà è che è tanto valido quanto il materiale su cui poggia: voglio dire che si tende a pensare che rimuova il bisogno di un traduttore umano, ma in realtà lavora su traduzioni esistenti, ragion per cui la qualità finale dipende da quella delle traduzioni originali. Se si attinge a materiale scadente, non c’è molto spazio per migliorare».

C’è anche un altro aspetto da considerare quando si vagheggia di una nuova Babele: è vero che internet favorisce la pluralità linguistica, ma non per tutti. «Le lingue minoritarie — spiega Claudia Soria dell’Istituto di Linguistica computazionale del Cnr — faticano a trovare spazio sul web. L’italiano, usando l’alfabeto latino non ha particolari problemi, ma ci sono lingue per cui non esistono tasti, o le combinazioni da tastiera sono troppo farraginose per essere adoperate efficacemente: questo vale per lingue native americane, maya, ma anche per lingue o dialetti come il friulano o il piemontese». Ridotto anche il corpus di traduzioni disponibili da e per queste altre lingue «minori», ragion per cui occorrono investimenti in tecnologie che consentano a chi le parla di non restare escluso dal grande abbraccio della Rete.

In un futuro non troppo lontano, però, anche questi problemi potrebbero essere risolti e internet potrebbe davvero eliminare il bisogno di una qualsiasi «lingua franca»: basterà collegarsi a un software in Rete, per capirsi a vicenda, che si tratti di consultare un sito o chattare su Facebook. Già oggi Facebook fornisce — tramite Bing — un servizio di traduzione in linea dei post nelle principali lingue europee, e Twitter ha iniziato a sperimentare la traduzione dei tweet, partendo da quelli di alcuni esponenti politici egiziani. Anche qui, il nodo è l’affidabilità del materiale: soprattutto quando a parlare è un personaggio pubblico, è importante essere certi che un’affermazione sia stata riportata bene, rispettandone tutte le sfumature. La natura dei social network è quella di amplificare velocemente i contenuti inseriti, veri o falsi che siano. E come esiste oggi un problema relativo alla contraffazione delle immagini che viaggiano su Twitter, un domani potrebbe essere necessario verificare la correttezza dei testi tradotti per evitare di amplificare affermazioni non vere.

Ma cosa accadrà una volta che saremo in grado di bypassare davvero le barriere linguistiche? Affrancati dalla supremazia dell’inglese, vivremo in un mondo finalmente multiculturale? Non è detto che sia così. Anzi, potrebbe accadere proprio il contrario. «Se non ci fosse più bisogno — spiega Cronin — di imparare le lingue straniere per comunicare con persone di altre nazioni, si aprirebbero scenari positivi sul piano della tutela della diversità linguistica, ma terrificanti sotto altri aspetti. Rischieremmo di restare prigionieri di una sorta di “bolla” tecnologica non imparando più, non soltanto gli idiomi altrui, ma neppure la cultura che li accompagna». Semplici emittenti e riceventi di informazioni; in grado, sì, di comunicare, ma non di comprendersi.
Twitter @fede_guerrini

Federico Guerrini

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...