- By - Astrid
- Posted on
- Posted in Veranstaltungen
Minimaldatensatz Historische Ortsdaten
Minimaldatensatz Historische Ortsdaten
Heute war einer dieser Termine, bei denen man erst im Nachhinein merkt, wie grundlegend das eigentlich Besprochene ist. Ich war bei einer Veranstaltung der Reihe „Von Büchern zu Bytes“ von NFDI4Memory, und im Zentrum stand ein Thema, das auf den ersten Blick technisch wirkt, aber sehr schnell ziemlich grundlegende Fragen historischer Arbeit berührt: Ortsdaten – und wie man sie sinnvoll standardisiert.
Der Einstieg war angenehm konkret. Statt direkt mit Lösungen zu beginnen, wurden zunächst die Probleme sichtbar gemacht. Und davon gibt es einige. Ortsdaten wirken oft selbstverständlich, sind es aber nicht. Unterschiedliche Schreibweisen, verschiedene Sprachen, historische Namensvarianten oder schlicht ungenaue Angaben führen dazu, dass Datensätze kaum miteinander vergleichbar sind. Selbst grundlegende Dinge wie Koordinaten sind nicht so eindeutig, wie man vielleicht denkt.
Genau hier setzt die Idee eines Minimaldatensatzes an: ein gemeinsamer Nenner, auf den sich verschiedene Projekte einigen können. Ziel ist es, Daten so zu strukturieren, dass sie vergleichbar und zusammenführbar werden, ohne dabei so komplex zu werden, dass die Anwendung in der Praxis scheitert.
Der vorgestellte Datensatz konzentriert sich deshalb auf wenige, aber zentrale Informationen. Dazu gehört zunächst der Name eines Ortes, der allerdings selten so eindeutig ist, wie er auf den ersten Blick scheint. Je nach Epoche, Quelle oder Kontext kann ein Ort unterschiedlich bezeichnet sein, weshalb es sinnvoll ist, auch verschiedene Namensvarianten mitzudenken und zu dokumentieren. Gerade in der historischen Arbeit ist das entscheidend, weil sich nur so unterschiedliche Quellen und Datenbestände sinnvoll miteinander verknüpfen lassen.
Hinzu kommen grundlegende historische Eckdaten wie Gründungs- oder Aufgabezeitpunkte, die helfen, einen Ort zeitlich einzuordnen. Ebenso zentral sind geografische Angaben. Gleichzeitig wurde deutlich, dass gerade hier viele Probleme beginnen. Ein Ort ist kein Punkt – zumindest nicht im historischen oder geographischen Sinne. Selbst ein einzelnes Gebäude hat eine Ausdehnung, ganz zu schweigen von Dörfern oder Städten. Theoretisch könnte man mit Polygonen arbeiten, also Flächen statt Punkte erfassen, doch das ist in der Praxis oft zu aufwendig und für viele Projekte nicht leistbar. Deshalb bleibt man meist bei einer einzelnen Koordinate. Aber auch dann stellt sich die Frage: Welche? Dorfkirche? Marktplatz? Geometrischer Mittelpunkt? Und was, wenn es diese Referenzpunkte gar nicht gibt?
Diese scheinbar technische Entscheidung ist eng damit verbunden, wie transparent die Daten später sind. Wenn man sich für eine bestimmte Koordinate entscheidet, sollte nachvollziehbar bleiben, wie diese zustande gekommen ist. Deshalb gehört zu einem solchen Datensatz auch, die zugrunde liegenden Quellen zu dokumentieren. Daten stehen nicht für sich selbst, sondern müssen überprüfbar bleiben. Gerade bei widersprüchlichen Angaben wird das zentral. Ergänzend braucht es Raum für Anmerkungen, in denen Unsicherheiten oder Besonderheiten festgehalten werden können, die sich nicht in klar strukturierte Kategorien pressen lassen.
Damit bleibt der Minimaldatensatz überschaubar, wird aber gleichzeitig so erweitert, dass er in der Praxis tatsächlich nutzbar ist. Die Herausforderung besteht weniger darin, möglichst viele Informationen zu sammeln, sondern die richtigen auszuwählen und so zu strukturieren, dass sie anschlussfähig bleiben.
Richtig greifbar wurde das Ganze dann in der Praxisübung. In kleinen Gruppen haben wir versucht, für einen konkreten Ort selbst einen solchen Datensatz zu erstellen. Dabei traten die zuvor diskutierten Schwierigkeiten sofort auf. In unserem Fall gab es den Ort in einer Datenbank einmal, in einer anderen aber gleich zweimal. Der Grund war schnell gefunden: Neben dem historischen Ort existiert heute ein Naturschutzgebiet mit demselben Namen. Für die Übung war klar, dass nur der Ort relevant ist – aber das Beispiel zeigt, wie schnell es zu Mehrdeutigkeiten kommt.
Ein anderes klassisches Problem sind gleichnamige Orte. Selbst in räumlicher Nähe können Orte identische Namen tragen. Ohne zusätzliche Kontextinformationen wird es dann schwierig, eindeutig zuzuordnen, welcher gemeint ist. Das gilt umso mehr, wenn man mit Quellen wie Briefen arbeitet, in denen Ortsangaben oft knapp, uneinheitlich oder fehlerhaft sind. Auch die Schreibweise kann hier zur Herausforderung werden, weil sie nicht standardisiert ist und sich erst aus dem Kontext erschließen lässt.
Am Ende wurden die Ergebnisse gemeinsam besprochen. Besonders interessant war dabei der Vergleich: Welche Gruppe ist über welche Probleme gestolpert? Welche Lösungen wurden gefunden? Und wo bleiben Unsicherheiten bestehen? Es ging viel darum, Strategien im Umgang mit Unschärfen zu entwickeln, nicht darum, sie vollständig zu eliminieren.
Die Veranstaltung war insgesamt sehr gut strukturiert, die Betreuung in den Gruppen hilfreich, und es gab genug Raum für Fragen. Gleichzeitig wurde nichts unnötig überkomplex dargestellt, was bei dem Thema durchaus möglich gewesen wäre.
Für mich bleibt vor allem die Erkenntnis, dass saubere Datenarbeit nicht erst bei der Analyse beginnt, sondern schon bei scheinbar einfachen Dingen wie Ortsangaben. Und dass „einfach“ in diesem Kontext nur selten wirklich einfach ist.


