Du hörst das? Das ist das Geräusch, wenn Leute überall sagen: „Können sie das?“ Nachdem ich gelesen hatte, wie Forscher Bildgebung, Computer Vision und maschinelles Lernen nutzten, um antike römische Texte in etwas zu lesen, das die meisten beim Betrachten für kaum mehr als ein Stück Holzkohle halten würden.
Die 2000 Jahre alte Schriftrolle ist eine von mehr als 800 Schriftrollen, die in den Ruinen von Herculaneum entdeckt wurden, einer römischen Stadt, die beim Ausbruch des Vesuvs im Jahr 79 n. Chr. begraben wurde. Durch den Ausbruch verkohlt, ist jede Schriftrolle unglaublich zerbrechlich und jeder Versuch, sie zu öffnen Eines nach oben, um zu sehen, ob es irgendwie lesbar ist, hat in einem bröckelnden Durcheinander geendet. Dennoch waren Forscher bestrebt, die in diesen Schriftrollen gespeicherten Geheimnisse zu entschlüsseln, und es sieht so aus, als hätte sich maschinelles Lernen als Schlüssel dazu erwiesen.
Zunächst wurde die von den Forschern gelesene Schriftrolle virtuell ausgepackt. Dieser komplexe Prozess umfasst das Scannen der Schriftrolle, das an einem Teilchenbeschleuniger in der Nähe von Oxford, Großbritannien, stattfand. Dann wurden diese zerknitterten Schichten zu flachen Papyrusschichten entfaltet – natürlich immer noch virtuell.
„Die Röntgenfotos werden mithilfe tomografischer Rekonstruktionsalgorithmen in ein 3D-Voxelvolumen umgewandelt, was zu einem Stapel von Schnittbildern führt“, heißt es auf der Webseite der Vesuvius Challenge.
Anschließend wurde an den entfalteten Schichten ein Schritt namens „Tintenerkennung“ durchgeführt, der mithilfe eines maschinellen Lernmodells die eingefärbten Bereiche des Papyrus identifiziert.
Verschiedene Forscherteams haben dann versucht, Text aus den Schriftrollen zu extrahieren, als Teil einer sogenannten „ Vesuv-Herausforderung. Jedes Team nutzte verschiedene Methoden, Modelle und Verbesserungen der zuvor entwickelten Methoden, um mehr von dem aufzudecken, was diese Schriftrollen verbergen. Jedes Team hatte dann bis zum 1. Januar 2024 um Mitternacht Zeit, seine Ergebnisse einzureichen, um an der Herausforderung teilzunehmen, bevor ein Team „hervorragender Papyrologen“ jeden Beitrag überprüfte, um die Ergebnisse zu überprüfen. Das Gewinnerteam gewann 700.000 US-Dollar.
Das Gewinnerteam – bestehend aus Youssef Nader, Luke Farritor und Julian Schillinger – reichte einen Beitrag ein, der von allen Juroren als der am besten lesbare von allen bewertet wurde. So haben sie es gemacht, so ein nicht berühmter Nicht-Papyrologe (ich).
Der Ansatz des Teams baute auf einer früheren Entdeckung eines Knistermusters auf, das letztes Jahr von Casey Handmer entdeckt wurde. Dies wurde später von Luke Farritor weiterentwickelt, der im Rahmen seiner jüngsten preisgekrönten Bemühungen eine GTX 1070 verwendete. Andere Forscherteams, darunter ein weiteres Mitglied des Gewinnerteams, Youssef Nader, hatten ebenfalls hervorragende Modelle für maschinelles Lernen zum Erkennen von Tinte anhand heruntergefallener Fragmente der Schriftrollen entwickelt, obwohl diese offenbar nur bei Fragmenten und nicht bei aufgerolltem Papyrus gut zu funktionieren schienen .
Das Gewinnerteam nutzte das kombinierte Wissen dieser Ansätze, um mit den aufgerollten Schriftrollenresten die klarsten Ergebnisse zu erzielen.
„Die Einreichung enthält Ergebnisse von drei verschiedenen Modellarchitekturen, die jeweils die Ergebnisse der anderen unterstützen, wobei die stärksten Bilder häufig von einem TimeSformer-basierten Modell stammen … Zusätzlich zur beispiellosen Tintenerkennung enthielt die Gewinnereinreichung den stärksten Ansatz zur automatischen Segmentierung, den wir hatten bisher gesehen habe.“
Aufgrund der Arbeit aller Forscherteams, die sich mit diesem brüchigen Thema befassen, sind mittlerweile etwa 5 % der ersten Schriftrolle gelesen. Und deshalb wurde jetzt der Hauptpreis der Vesuvius Challenge 2024 angekündigt, mit dem ehrgeizigen Ziel, von den jetzt bekannten 5 % auf 90 % aller vier gescannten Schriftrollen zu steigen.
Es gibt also definitiv noch viel zu tun, um mehr darüber zu verstehen, aber auch heute noch haben die Forscher eine Vorstellung davon, was darin steht: „Wie auch im Fall von Lebensmitteln glauben wir nicht sofort, dass Dinge, die knapp sind, absolut mehr sind.“ angenehmer als diejenigen, die reichlich vorhanden sind.
Ja, es geht um die Freuden des Lebens oder um das, was man Epikureismus nennt. Zumindest für diesen Abschnitt nämlich die Freude, sich das Gesicht vollzustopfen.