AI versnelt ontcijfering van historische manuscripten


In het kort

  • AI versnelt het ontcijferen van historische manuscripten.
  • Geïntegreerde tools combineren transcriptie en vertaling om fouten te voorkomen.
  • Schaalbare machine learning heeft als doel oude, onopgeloste talen te ontcijferen.

Wereldwijde archieven en bibliotheken herbergen een enorme verzameling versleutelde documenten. Schattingen suggereren dat deze instellingen ongeveer 1 procent van dit historische materiaal gecodeerd hebben. Deze manuscripten bevatten een breed scala aan verborgen informatie. Dit gaat van clandestiene politieke samenzweringen en rituelen van geheime genootschappen tot persoonlijke romantische brieven en verboden medische kennis. Omdat deze teksten vaak hiaten in ons historisch begrip opvullen, kan het ontcijferen ervan ons perspectief op beroemde figuren of hele tijdperken fundamenteel veranderen.

Decoderen van historische codes blijft zware klus

Het proces om deze codes te kraken is van oudsher een zware klus. Historici worden vaak geconfronteerd met obstakels zoals vervagende inkt, onleesbaar handschrift en “afleidingssymbolen” die bedoeld zijn om lezers te misleiden. Sommige codes zijn simpele vervangingen. Andere zijn ongelooflijk complex, met meerdere verschillende symbolen voor één letter of het gebruik van onbekende talen. Zo kostte het cryptologen zes maanden om een brief van drie pagina’s van de Heilige Roomse keizer Karel V te ontcijferen. Hieruit bleek uiteindelijk dat de vorst intens bang was om vermoord te worden.

AI als hulpmiddel voor ontcijfering

Artificiële intelligentie versnelt dit ontcijferingsproces nu drastisch. Machine learning wordt gebruikt om manuscripten als de Borg-code te ontcijferen. Dat is een 400 jaar oud boek uit het Vaticaan vol obscure symbolen. Eenmaal ontcijferd via AI onthulde de tekst honderden vreemde medische remedies, zoals het gebruik van gefermenteerde nootmuskaat om dysenterie te behandelen. Op dezelfde manier heeft het AI-platform Transkribus onderzoekers geholpen bij het digitaliseren van 17de-eeuwse documenten uit de Dertigjarige Oorlog. Zo heeft het softwareprogramma handgeschreven teksten omgezet in machinaal leesbare tekst. Hierdoor konden taalkundigen vervolgens waarschuwingen over militaire samenzweringen ontdekken.

Geïntegreerde AI-oplossingen

De huidige innovaties gaan steeds meer richting een geïntegreerde aanpak. Het Descrypt-project ontwikkelt tools die transcriptie en decodering in één stap combineren, waardoor het mogelijk niet meer nodig is om een tekst eerst handmatig te digitaliseren. Door AI te trainen op paren van cijfertekens en hun bekende betekenissen, hebben onderzoekers een tool in chatbot-stijl gemaakt. Dit systeem kan een foto van een gecodeerde pagina analyseren en een vertaling en een logische uitleg voor de oplossing geven, waardoor wordt voorkomen dat de AI valse betekenissen ‘hallucineert’.

In tests met de Borg-code heeft deze nieuwe AI-tool een passage van 500 tekens in slechts 29 minuten ontcijferd, inclusief een Engelse vertaling. Onderzoekers bouwen nu uitgebreide databases met gecodeerde teksten om deze modellen verder te trainen. Het uiteindelijke doel is om deze schaalbare, patroonzoekende AI-methoden toe te passen op ’s werelds meest hardnekkige mysteries, zoals de schijf van Phaistos of Lineair B, waardoor mogelijk oude talen worden ontcijferd die al millennia lang verborgen zijn gebleven.

Schrijf je hieronder in voor onze GRATIS nieuwsbrief

Voeg newsmonekey.be toe als preferred source op Google
Meer
Lees meer...
301 Moved Permanently

301 Moved Permanently


nginx/1.14.1