Decine di migliaia di tavolette cuneiformi sono in attesa di essere tradotte. Non è un compito facile; l’antica lingua si basa su pittogrammi a forma di cuneo e include più di 1.000 caratteri unici che variano per epoca, geografia e scrittore individuale. Ma decifrare i pittogrammi potrebbe essere un compito di grande rilevanza culturale e storica. Il cuneiforme è nato circa 5.000 anni fa in Mesopotamia, nell’attuale Iraq. È una delle quattro lingue conosciute come “pristine” — sistemi di scrittura senza influenze note da altre lingue. Alcune tavolette cuneiformi tradotte hanno rivelato contenuti banali come un registro di inventario per la spedizione. Altre sono state più profonde, come l’”Epopea di Gilgamesh,” la prima opera letteraria scritta conosciuta. Quelle traduzioni, fatte da un numero relativamente esiguo di individui che conoscono la lingua, hanno richiesto molto lavoro — e forse qualche congettura. Decifrare tale complessità sarebbe il lavoro perfetto per l’intelligenza artificiale, hanno pensato alcuni ricercatori della Cornell University, che, con colleghi dell’Università di Tel Aviv, hanno creato un sistema per fare proprio questo, come riportano in un articolo che sarà presentato a una conferenza nell’aprile 2025.
Il team di ricerca ha sviluppato un sistema che supera i molti ostacoli che le variazioni presentano alla traduzione. “Quando si torna al mondo antico, c’è una grande variabilità nelle forme dei caratteri,” ha detto Hadar Averbuch-Elor, professore di informatica alla Cornell che ha guidato la ricerca, in un comunicato stampa. “Anche con lo stesso carattere, l’aspetto cambia nel tempo, quindi è un problema molto impegnativo riuscire a decifrare automaticamente cosa significa effettivamente il carattere.” Il sistema informatico legge le fotografie delle tavolette di argilla cuneiformi, poi si adatta sovrapponendo computazionalmente le immagini a quelle con caratteristiche simili, e il cui significato è noto. Poiché il sistema allinea automaticamente le due immagini fino a farle combaciare digitalmente, hanno chiamato il sistema ProtoSnap.
Nel documento, i ricercatori hanno dimostrato che i caratteri allineati possono essere utilizzati per addestrare il sistema a vedere altre somiglianze tra altri caratteri successivamente nel processo, ciò che chiamano downstream. Quando il sistema ha ricevuto tale addestramento, ProtoSnap ha ottenuto risultati molto migliori nel riconoscere i caratteri cuneiformi — anche quelli rari o con molte differenze — rispetto agli sforzi precedenti dell’IA. Questo progresso potrebbe aiutare ad automatizzare il processo di lettura delle tavolette. Ciò risparmierebbe un’enorme quantità di tempo. Potrebbe anche aiutare gli studiosi a confrontare meglio gli scritti di tempi, città e autori diversi. Ma soprattutto, accelererebbe notevolmente il processo di traduzione — dando infine al mondo accesso a un’abbondanza di scritti antichi.
“La base della nostra ricerca è l’obiettivo di aumentare di dieci volte le fonti antiche a nostra disposizione,” ha detto Yoram Cohen, co-autore e professore di archeologia alla TAU, nel comunicato stampa. “Questo ci permetterà, per la prima volta, di manipolare big data, portando a nuove intuizioni misurabili sulle società antiche — la loro religione, economia, vita sociale e legale.” Sebbene molte tavolette tradotte probabilmente mostreranno solo, ad esempio, una ricevuta per l’acquisto di bestiame, altre potrebbero contenere affascinanti resoconti storici — o persino un altro poema epico.