Die unzureichende Anonymisierung von Gerichtsurteilen – Im Gespräch mit Dr. Dominic Deuber

Gerichtsurteile sind sehr sensible Dokumente und müssen entsprechend geschützt werden. Schließlich handelt es sich oft um äußerst delikate Streitigkeiten. In Deutschland wurden laut einer Studie zwischen den Jahren 2011 und 2020 nur etwas mehr als zwei Prozent aller Entscheidungen veröffentlicht. Wichtige Informationen müssen dabei laut dem Gesetzgeber so anonymisiert sein, dass sie nur mit „unverhältnismäßigen Aufwand“ deanonymisiert werden können. Doch ist das tatsächlich der Fall?

Mit dieser Frage hat sich unter anderem Dr. Dominic Deuber beschäftigt. Er ist Forschungsgruppenleiter am Lehrstuhl für Angewandte Kryptografie an der Friedrich-Alexander- Universität Erlangen-Nürnberg und hat gemeinsam mit seinen Co-Autoren Michael Keuchen und Nicolas Christin die Anonymisierung von deutschen Gerichtsentscheidungen untersucht. Im Interview erzählt Deuber von Verstößen gegen IT-Sicherheitsstandards und welche verheerenden Folgen ein Fehler haben kann.

Foto: Peter Becher

Herr Deuber, Gerichte besitzen allgemein keine einheitlichen Richtlinien für die Anonymisierung von Urteilen. Ist das ein Grund, weshalb die Urteile leichter deanonymisiert werden können?

Ja genau, und weil eben hinter den Anforderungen teilweise zurückgeblieben wird. Die Ergebnisse haben sogar gezeigt, dass ein Bundesland gegen Standards der IT-Sicherheit verstieß. Es ist entscheidend, dass bei der Anonymisierung der notwendige Grad erreicht wird, also dass das Urteil gerade nicht mit verhältnismäßigem Aufwand deanonymisierbar ist. Allerdings handelt es sich hier um einen auslegungsbedürftigen Rechtsbegriff.

Im Rahmen Ihrer Studie haben Sie 54 Jura-Student*innen gebeten die Urteile zu deanonymisieren. Dabei hatten die Probanden maximal 35 Minuten Zeit pro Urteil. Gab es weitere Anweisungen?

Wir haben im Prinzip den Studis einfach nur gesagt: „Hier ist das Urteil. Deanonymisiere es!“ Wir haben keine Vorgaben gemacht, wie sie dabei vorgehen sollen. Natürlich haben wir auch Beispiele gegeben, damit die Leute nicht komplett in die falsche Richtung laufen und wissen, was genau zu dokumentieren ist.

Welche Anonymisierungstechniken haben am Ende denn besonders gut beziehungsweise schlecht funktioniert?

Viele Entscheidungen waren vermeintlich dadurch anonymisiert, dass man die entsprechenden Textstellen auf die Anfangsbuchstaben reduziert hat. So wurde aus „Olivia Burns“ zum Beispiel „O.B.“. Diese Technik hat sich auch als am verwundbarsten erwiesen. Wenn man auf Auslassungen zurückgreift, also zum Beispiel „XXX“ schreibt, dann wird es schon um einiges schwieriger. Wenn ich von vornherein weiß, dass es sich um Initialen handelt, bietet das einen Angriffspunkt. Daher sollte man diese Technik unbedingt vermeiden. Das war auch eine unserer Hauptempfehlungen.

Wie genau kann der aktuelle Zustand verbessert werden?

Generell gilt: Je mehr Informationen entfernt werden, desto besser. Und idealerweise sollten Aspekte gar nicht erst auftauchen, wenn sie für die Entscheidung nicht relevant sind. Zusätzlich muss mehr anonymisiert werden. Denn oftmals reicht es eben nicht, wenn die Gerichte nur den Namen entfernen, weil ein potenzieller Angreifer über andere Details aus der Entscheidung Rückschlüsse ziehen kann. Schließlich muss auch noch konsistenter anonymisiert werden und auch die Presse sollte darauf achten, die Anonymisierung nicht zu unterwandern.

Sie haben bereits die Prinzipien der IT-Sicherheit angesprochen, könnten Sie das näher erläutern?

Eines der grundlegenden Prinzipien der IT-Sicherheit lautet: Ich muss mein Verfahren offenlegen können und es ist danach trotzdem noch sicher. Also ich kriege die Sicherheit in der Regel nicht durch die Geheimhaltung des Verfahrens. Laut einem Urteil aus dem Jahr 2020 versucht ein Teil der Justiz allerdings ihre Anonymisierungsrichtlinien bewusst zu verbergen. Genau das hat uns motiviert diese Anonymisierungsverfahren zu brechen. Die Ergebnisse hierzu wurden von uns separat veröffentlicht.

Ihre Studie konnte schließlich ermitteln, dass ein Teil der Informationen überhaupt nicht anonymisiert waren. Wie kann sowas überhaupt passieren?

Größtenteils wird noch manuell anonymisiert und dabei passieren schnell Fehler. Ein Beispiel: Im gesamten Urteil wird Müller mit zwei „l“ geschrieben und an einer Stelle fehlt bei Müller ein „l“. Und wenn die zuständige Person dann die Suchen-und-Ersetzen-Funktion nutzt, um Müller zu entfernen, dann entfernt sie es überall dort, wo es genau mit „ll“ geschrieben wird. Und das sind so typische Probleme, die auftreten können. Eine Hilfe könnte bei solchen Vorgängen die Automatisierung darstellen.

Automatisierung ist ein gutes Stichwort. Des Weiteren haben sie versucht die Deanonymisierung zu automatisieren. Wie ist da der Forschungsstand?

Manche Urteile aus unserem Experiment haben wir von der Künstlichen Intelligenz ChatGPT deanonymisieren lassen. Die Ergebnisse, die wir dabei erhalten haben, waren teilweise schon erschreckend. Der ganze Aufwand, den die Studis jetzt bei uns hatten: Die Entscheidung lesen, analysieren, erkennen, was genau daran anonymisiert ist und so weiter. All das sind Prozesse, die durch so ein Modell automatisiert werden können. Konkrete Ergebnisse existieren hierzu allerdings noch nicht.

Wenn Sie auf die gesamten Studienergebnisse zurückblicken. Was hat Sie persönlich am meisten überrascht?

Ich hätte nicht erwartet, dass man davon ausgeht, mit der Reduzierung auf Anfangsbuchstaben hätte man eine sichere Anonymisierung erreicht. Aber auch der Verstoß gegen grundlegende Prinzipien der IT-Sicherheit, die eben nicht in den letzten zehn Jahren entwickelt wurden. Das sind Dinge, die ich mir nicht erklären kann. Da frage ich mich immer, warum konsultieren die Verantwortlichen da nicht einfach Experten und fragen, wie man es machen soll.

Welche Änderungen erhoffen Sie sich für die Zukunft?

Ich hoffe einfach, dass gerade in unseren Zeiten, wo die Bedrohungsszenarien gefühlt immer größer werden, mehr erkannt und auch mehr gehandelt wird. Das solche Sachen wie: „Ich verstecke mein Verschlüsselungsverfahren und denke, dann ist es sicher“, nicht mehr passieren. Aber eben auch, dass die Verantwortlichen es nicht für eine gute Idee halten Anfangsbuchstaben zur sicheren Anonymisierung einzusetzen.