Transkribus

16.04.2026 / Autor: Martin

Ich habe einen Ordner mit Kopien alter Dokumente, die noch auf Entzifferung warten. Und sie warten schon länger. Weil meine Kenntnisse zu Kurrent doch zu schlecht sind. Ich kann Kirchenbücher halbwegs entziffern, weil ich weiss, welche Informationen da kommen können. Die Formulierungen sind oftmals ähnlich und bei den Namen muss ich lange vergleichen. Aber das sind immer nur einzelne Worte, nie längere Absätze.

In meinem Ordner habe ich Kaufverträge von 1800, geschrieben von einem schlechtgelaunten Schreiber in irgendeiner Amtsstube. Die grundsätzlichen Abschnitte des Dokuments lassen sich erkennen, aber der Inhalt ist unstrukturiert und furchtbar gekritzelt. Satzanfänge hat er mit künstlerischer Akribie bis ins Extrem verschnörkelt, aber der eigentliche Satz ist ein auf-und-ab von ähnlichen Häkchen. Öfters habe ich mir die Dokumente angesehen, immer wieder habe ich sie frustriert in den Ordner zurück.

Dann fand ich einen Hinweis auf Transkribus. Und ich bin begeistert, was die Software aus dem Dokument erkennen kann.

Natürlich kann sie (noch) keine Wunder bewirken. Aber sie übersetzt 80 Prozent des Textes, womit man schon einmal den Sinn sehr gut erkennen kann. Und bei den fehlerhaft erkannten Worten kann man recht einfach korrigieren und erhält den kompletten Satz in nahezu fehlerhafter Transkription. Natürlich kann Transkribus nicht die zusammengewürfelten Textbereiche auf dem Dokument voneinander abgrenzen, da gibt es Vermischungen, aber durch Highlighting im Dokument erkennt man, welcher Text zu welchem Wort im Dokument gehört. So kann man die Zusammenhänge manuell leicht herstellen.

Ich werde in der nächsten Zeit wieder einmal den Ordner in die Hand nehmen. Und hoffentlich dieses Mal nicht frustriert zurücklegen.

[Link: www.transkribus.org]

 

Künstliche Intelligenz in der Ahnenforschung

01.05.2026 / Autor: Martin

Ich erlebe in der letzten Zeit eine deutliche Ablehnung von künstlicher Intelligenz bei den Mitgliedern von Ahnenforschungsgruppen. Zumindest bei denen, die nur ihren Daten glauben. Daten sie sie selber erhoben haben, in Archiven aus alten Dokumenten extrahiert haben. Mit wissenschaftlicher Präzision. Alles andere lehnen sie ab.

Ich kann ihnen teilweise zustimmen, weil es auch die Gruppe von Ahnenforschern gibt, die ungeprüft Daten in ihren Stammbaum übernehmen. Und so Stammbäume generieren, deren Umfang die eigene Familie um ein Vielfaches übersteigt. Wie will man hier eine valide Datenbasis schaffen? Das geht nicht. Mein eigener Stammbaum hat ein paar Hundert Personen. Ich stoße hier schon an Grenzen, weil ich nicht bestätigen oder wiederlegen kann, ob ich eine oder zwei Personen mit gleichem Namen habe. Der zeitliche und räumliche Zusammenhang ist da, aber trotzdem passt irgendwas nicht.

Hier kommt die künstliche Intelligenz ins Spiel. Könnte man sie nicht nutzen, um Informationen aus einer Quelle auszuwerten und mit dem vorhandenen Datenbestand zu vergleichen?

Hier sind wir genau an dem Punkt, bei der die erstgenannten Forscher gerne ablehnen. Das eine KI entscheiden soll. Und genau hier ist ihr Denkfehler. KI darf nie entscheiden, der Mensch muss entscheiden. Der Mensch muss die Vorschläge der KI prüfen.