Ai tempi antichi, la traduzione linguistica era una professione altamente specializzata, cruciale per coordinare la diplomazia o il commercio internazionale. Il primo dizionario bilingue, “Vocabularius ex quo”, era un insieme di parole tedesco-latino pubblicato nel 1467, mentre tavolette di argilla contenenti elenchi di opere in sumero e accadico risalgono già al 2300 a.C. La traduzione linguistica è diventata più facile nel corso degli anni grazie al lavoro di linguisti e altri antropologi. Lo sviluppo dei computer e, dell’intelligenza artificiale, ha dato una spinta enorme alla traduzione linguistica, portandola fuori dalle mani degli specialisti o dai libri pesanti e nei nostri telefoni. Ma come si sono sviluppate nel tempo le applicazioni di traduzione come Google Translate e quali erano i loro predecessori?
Come è iniziata la traduzione con i computer
Le persone hanno cercato di utilizzare i computer per tradurre le lingue sin dalla metà del XX secolo. “L’idea della traduzione online era qualcosa a cui le persone aspiravano quando i computer hanno iniziato a diffondersi,” dice Jaroslaw Kutylowski, CEO di DeepL, una società che fornisce servizi di traduzione utilizzando sistemi neurali. In effetti, uno dei primi usi dei computer per qualcosa oltre i numeri fu un esperimento condotto nel 1954 dopo diversi anni di lavoro da parte dei ricercatori della Georgetown University e IBM. La dimostrazione tradusse solo circa 250 parole utilizzando sei regole grammaticali — per lo più brevi dichiarazioni in russo su scienza, diritto e affari militari che furono convertite in inglese in pochi secondi. Le possibilità di questo programma erano però limitate, e la traduzione richiedeva molta post-elaborazione. Non furono fatti molti progressi nel decennio successivo. In effetti, gli esperimenti furono così deludenti che un rapporto pubblicato nel 1966 dal Comitato Consultivo per l’Elaborazione Automatica del Linguaggio, istituito dal governo degli Stati Uniti e composto da linguisti e ricercatori di traduzione automatica, determinò che non c’era molta speranza a breve termine. “Il Comitato crede infatti che sia saggio andare avanti imperterriti, in nome della scienza, ma che il motivo per farlo non possa ragionevolmente essere alcun miglioramento prevedibile nella traduzione pratica,” diceva il rapporto.
L’inizio di SYSTRAN
Il rapporto uccise effettivamente la maggior parte del lavoro sulla traduzione per anni, tranne che per System and Translation (SYSTRAN). Peter Toma, uno scienziato che credeva che la strada per la pace mondiale potesse essere raggiunta attraverso la comunicazione, avviò SYSTRAN alla fine degli anni ’60. La società lavorò con l’Aeronautica degli Stati Uniti e utilizzò macchine per tradurre istruzioni dal russo all’inglese per il Progetto di Test Apollo-Soyuz, una missione spaziale congiunta USA-URSS lanciata nel 1975. SYSTRAN continuò a sviluppare il loro prodotto, che fu utilizzato dal motore di ricerca online AltaVista, che creò Babel Fish alla fine degli anni ’90, e che sarebbe stato poi acquistato da Yahoo! Almeno nei primi tempi, lo strumento aveva capacità di traduzione limitate, gestendo solo fino a 150 parole. “È un sacco di lavoro, e richiede uno sforzo combinato di linguisti e programmatori,” dice Kutylowski, aggiungendo che diventa ancora più complicato con lingue con “grammatica incredibilmente complicata” come il giapponese o il finlandese. Google non raggiunse Yahoo! fino al 2006, quando lanciò Google Translate. Quest’ultimo è diventato sempre più sofisticato, passando dalla semplice traduzione di testo online alle applicazioni per telefoni. Nel 2014, Google acquisì Word Lens, che permetteva agli utenti di puntare la fotocamera del telefono su parole scritte su cose come segnali stradali o menu e ottenere una traduzione. Word Lens aiutò anche Google a migliorare la sua capacità di ascoltare parole pronunciate e tradurle.
Il ruolo dell’intelligenza artificiale
Il problema era che la traduzione linguistica rimaneva una scienza imperfetta nel migliore dei casi. In generale, il mondo della traduzione con i computer è passato dal tradurre una parola alla volta, a brevi frasi, a frasi complete in un periodo di circa mezzo secolo, dice Kutylowski. Ma le macchine sono ancora inclini a perdere cose come il contesto, rendendo a volte difficile tradurre parole con due o più significati. Ma nel 2016, l’intelligenza artificiale ha aperto nuove possibilità per la traduzione automatica. Google iniziò a lavorare con la traduzione automatica neurale, che essenzialmente significava creare una rete neurale che non traducesse solo parole o frasi, ma interi passaggi. DeepL iniziò a utilizzare reti neurali per costruire un programma di traduzione da vendere a società internazionali nel 2017. “Siamo stati in questa corsa all’oro delle reti neurali,” dice Kutylowski. “La traduzione ha un’applicazione così ampia sia nel privato che negli affari.” Per farlo correttamente, dice che sono necessari enormi quantità di passaggi già tradotti tra una lingua e l’altra. Gli esperti idealmente necessitano di testi scientifici, testi legali e tutti i tipi di linguaggio che vengono tradotti per insegnare ai sistemi di apprendimento automatico come operare meglio.
La traduzione automatica neurale è un tentativo di creare sistemi neurali che operino più come un cervello umano. Piuttosto che insegnargli la grammatica, dice Kutylowski, il sistema semplicemente raccoglie il testo e impara più come fanno gli umani, che possono apprendere una lingua senza imparare implicitamente alcuna regola grammaticale. “Quel processo di apprendimento complessivo, e l’operazione complessiva dei sistemi, va verso il modo in cui noi umani apprendiamo una lingua,” dice. Questi sistemi stanno diventando sempre migliori nella traduzione, ma probabilmente avranno sempre dei difetti. Il problema è che la comunicazione è una scienza imperfetta, anche per due umani che parlano la stessa lingua. Un programma di traduzione online può essere solo tanto buono nella traduzione quanto gli umani lo sono nella comunicazione in primo luogo.