Faksimiles und Volltexte

In etwa 200 Arbeitsstunden wurden rund 120 Verfachbuchbände im Südtiroler Landesarchiv in Bozen digital abgelichtet. Die dabei generierte Datenmenge beläuft sich auf über 53.000 Dateien beziehungsweise 270 Gigabyte.

Die Bilder wurden anschließend von Martin Kirnbauer in Transkribus hochgeladen, wobei die Digitalisate der einzelnen Verfachbuchbände jeweils zu einem Transkribus-Dokument zusammengefasst und diese dann mit einigen wesentlichen Metadaten versehen wurden:

  • Vergabe eines repräsentativen Dokumententitels nach dem Muster VVerfachbuch {Gericht}, Bd. {Bandnummer}, {Zeitraum}, also beispielsweise Verfachbuch Oberamtsgericht Bruneck, Bd. 199, 1764/1765
  • Nennung des Erzeugers der Digitalisate (Fotocredits)
  • Datierung der Bandes Date of writing From: DD/MM/YYYY To: DD/MM/YYYY
  • Übernahme allfälliger Anmerkungen zu Signatur und/oder Bandangabe

Ebenfalls von Martin Kirnbauer wurde anschließend eine Konkordanz zwischen den Transkribus-Dokumenten und den Datenbankeinträgen zu den Verfachbuch(objekten) der vorliegenden Webapplikation angelegt. Dies ermöglicht die Einbindung der Faksimiles in die Webapplikation.

Abgesehen von der Veröffentlichung der Bilder werden mittels Transkribus auch Volltexte beziehungsweise Transkripte aus den Faksimiles generiert. Dafür wird, basierend auf Transkriptionen angefertigt von Michael Prokosch, Michael Span und Peter Andorfer, ein eigenes Modell zur Handschriftenerkennung trainiert. Da das derzeitige Modell aufgrund der noch geringen Menge an Trainingsmaterial noch nicht die gewünschte Qualität erreicht hat, wurde erst ein kleiner Teil der digitalisierten Verfachbücher prozessiert. Im Laufe des Jahres 2020 werden jedoch sukzessive mehr Volltexte zugänglich gemacht werden.