O objetivo da plataforma electronic Babylonian Library (eBL) é acelerar o ritmo de reconstrução e publicação de tabuinhas cuneiformes em todo o mundo. Ao oferecer uma plataforma versátil para edição de tabuinhas e textos e para anotação de edições e fotografias, e um conjunto de ferramentas para pesquisa epigráfica, lexicográfica e historiográfica, ela visa acelerar dramaticamente o ritmo em que a documentação escrita da antiga Mesopotâmia é recuperada para o mundo moderno.
A plataforma eBL é baseada na Ludwig-Maximilians-Universität (LMU), de Munique, Alemanha e na Bayerische Akademie der Wissenschaften (BAdW) e hospedada pela Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften (LRZ).
Meio milhão de tabuinhas cuneiformes
Quantas tabuinhas cuneiformes da antiga Mesopotâmia os museus possuem? Onde estão?
Não há uma contagem oficial do número de tabuinhas cuneiformes da antiga Mesopotâmia mantidas por museus do mundo todo, mas os especialistas concordam que há cerca de meio milhão.
O maior acervo, de longe, está em poder do British Museum, em Londres, que possui aproximadamente 130 mil tabuinhas cuneiformes.
Em seguida, em ordem aproximadamente decrescente, estão o Museu Vorderasiatisches de Berlim, o Louvre em Paris, o Museu do Antigo Oriente em Istambul, o Museu de Bagdá e a Coleção Babilônica da Universidade de Yale, que, com 40.000 tabuinhas, tem o maior acervo nos Estados Unidos. Em segundo lugar, nos Estados Unidos, está o Museu de Arqueologia e Antropologia da Universidade da Pensilvânia.
Mas são poucos os especialistas em cuneiforme – fala-se em cerca de 500 – e assim muitos desses escritos não são lidos.
Fragmentarium
Para resolver isso, o Prof. Enrique Jiménez na Ludwig-Maximilians-Universität (LMU) de Munique, Alemanha, está utilizando, com sua equipe, técnicas avançadas de inteligência artificial (IA) para analisar e decifrar inscrições cuneiformes antigas, incluindo a Epopeia de Gilgámesh. Eles desenvolveram várias ferramentas e algoritmos para facilitar esse processo, que estão disponíveis em seus repositórios do GitHub.
É uma ferramenta que não existia antes, um enorme banco de dados de fragmentos. Ele pode desempenhar um papel vital na reconstrução da literatura babilônica. Apropriadamente chamado de Fragmentarium, ele foi projetado para juntar fragmentos de texto usando métodos sistemáticos e automatizados. Os especialistas esperam que o programa também seja capaz de identificar e transcrever fotos de escritas cuneiformes no futuro. Até o momento, milhares de fragmentos cuneiformes adicionais foram fotografados em colaboração com o Museu Britânico em Londres e o Museu do Iraque em Bagdá.
Este projeto utiliza tecnologias de Reconhecimento Óptico de Caracteres (OCR) e Processamento de Linguagem Natural (NLP) para ler e combinar os textos. Especificamente, usa OCR para converter os sinais cuneiformes de imagens em texto legível por máquina. A equipe do Prof. Enrique Jiménez então aplica algoritmos para detectar e combinar segmentos sobrepostos de diferentes manuscritos, auxiliando na reconstrução de textos fragmentados.
Veja no YouTube: KI Lectures an der LMU – Die Rekonstruktion altorientalischer Literatur durch den Einsatz von KI (Palestras sobre IA na LMU – A Reconstrução da Literatura do Antigo Oriente Médio através do uso de IA) – 6 de dez. de 2021.
The electronic Babylonian Library (eBL) Project brings together ancient Near Eastern specialists and data scientists to revolutionize the way in which the literature of Iraq in the first millennium BCE is reconstructed and analyzed. Generations of scholars have striven to explore the written culture of this period, in which literature in cuneiform script flourished to an unprecedented degree, but their efforts have been hampered by two factors: the literature’s fragmentary state of reconstruction and the lack of an electronic corpus of texts on which to perform computer-aided analyses.
The eBL project aims to overcome both challenges. First, a comprehensive electronic corpus has been compiled, and legacy raw material now largely inaccessible has been transcribed into a database of fragments (“Fragmentarium”). Secondly, a pioneering sequence alignment algorithm (“cuneiBLAST”) has been developed to query these corpora. This algorithm will propel the reconstruction of Babylonian literature forward by identifying hundreds of new pieces of text, not only in the course of the project but also in the decades to come.
In order to answer several fundamental and much-debated questions about the nature of the Babylonian poetic expression and the composition and transmission of the texts, three tools are being developed to data-mine the eBL corpus. The first will search for patterns in the spelling variants in the manuscripts, the second will find rhythmical patterns, and the third will sift the corpus for intertextual parallels. The bottom-up study of the corpus by means of these tools will decisively change our conceptions of how Babylonian literature was composed and experienced by ancient audiences (from AWOL – August 22, 2023).