Datenqualität für Numismatik basierend auf Natural Language Processing und Neuronalen Netzen
Data quality for Numismatics based on Natural language processing and Neural Networks
Beteiligte Institutionen:
Berlin-Brandenburgische Akademie der Wissenschaften
Münzkabinett – Staatliche Museen zu Berlin
Frankfurt/M. Goethe-Universität Frankfurt
Verantwortliche Personen:
Prof. Dr. Dr. hc. mult. Christoph Markschies
Prof. Dr. Bernhard Weisser
Dr. Karsten Tolle
Finanziert durch:
Förderprogramm „e-Research-Technologien“
Ziele:
Münzen als standardisierte Massenware sind seit Jahren eine beliebte Objektklasse bei der Ent-wicklung und Einführung digitaler Methoden in der Archäologie. Es sind verschiedene Münzportale entstanden bzw. werden aktuell entwickelt. Die Ziele solcher Forschungsportale reichen über die Zusammenführung und Verknüpfung von Sammlungsportalen hinaus. Vielmehr geht es darum, die zu Zigtausenden im Netz bereits vorhandenen Bilder und Beschreibungen wie auch die aus Grabungen stets neu hinzukommenden Informationen den Portalen zuweisen zu können und sie für wissenschaftliche Fragestellungen nutzbar zu machen. In diesem Projekt soll dies durch a) die Zuweisung aufgrund der Bestimmungen und Beschreibungen der Münzen (NLP) und b) die Zuweisung über die Münzbilder (Bilderkennung) erreicht werden. Ferner können die Methoden gegeneinander abgewogen werden und es soll ebenfalls getestet werden, inwieweit die gemeinsame Anwendung beider Ansätze (NLP und Bilderkennung) noch bessere Ergebnisse bringen kann.
Für die Deep Learning Ansätze hinter NLP und Bilderkennung sind möglichst große und qualitativ hochwertige Datenmengen eine wichtige Voraussetzung, wobei durch deren Erweiterung mit besseren Ergebnissen zu rechnen ist. Auch um die Forschung zur Münzgeschichte Thrakiens voranzubringen, bspw. um die Münzfüße richtig bestimmen zu können, bedarf es möglichst großer Datenmengen, die nur durch die Hilfe der computergestützten Methoden erstellt und auf ihre Datenqualität überprüft werden können.
Ziel des Projektes, das in die internationalen Bestrebungen um die Schaffung eines Online-Repositoriums für die antiken griechischen Münzen federführend eingebunden ist, soll es sein, jene Ansätze und Werkzeuge weiter zu entwickeln und zu implementieren, die nicht nur für das CN-Portal, sondern für die gesamte numismatische Gemeinschaft nützlich und darüber hinaus auf ähnliche Fragestellungen anderer Objekt-Gattungen (z. B. figürliche Darstellungen auf antiken Vasenbildern) übertragbar sind.
Dauer/Start:
36 Monate mit Zwischenevaluation, offizieller Start ca. Juli 2021
Sonstiges:
D4N4 ist der Nachfolger zum Corpus Nummorum Projekt
Links:
Corpus Nummorum Webportal