
Book Titles Open Access Full access
Training eines Sprachmodells in der Justiz
Urheberrechtliche und datenschutzrechtliche Anforderungen- Authors:
- |
- Series:
- Schriften zum Daten-, Informations- und Medienrecht, Volume 84
- Publisher:
- 2026
Summary
Language models offer great potential for generative use in the justice system, for example in the preparation of procedural facts and the drafting of court decisions. However, training a specific AI model for the judiciary based on German court files and decisions involves the processing of personal data within the meaning of the GDPR and the use of material protected under the German UrhG. This work addresses these challenges, comprehensively outlines the legal framework for training such a language model for use in the justice system, and provides answers to pressing legal questions. This Title is also Available as Open Access.
Keywords
Search publication
Bibliographic data
- Copyright year
- 2026
- ISBN-Print
- 978-3-7560-2041-6
- ISBN-Online
- 978-3-7489-5581-8
- Publisher
- Nomos, Baden-Baden
- Series
- Schriften zum Daten-, Informations- und Medienrecht
- Volume
- 84
- Language
- German
- Pages
- 204
- Product type
- Book Titles
Table of contents
ChapterPages
- Titelei/InhaltsverzeichnisPages 1 - 16 Download chapter (PDF)
- I. Projekt Generatives Sprachmodell für die deutsche Justiz (GSJ-Projekt)
- II. Tatsächliche Annahmen – Thematische Aus- und Eingrenzungen
- III. Technische Grundzüge des Sprachmodells und späteren KI-Systems
- B. Gutachtenauftrag und FragestellungenPages 23 - 24 Download chapter (PDF)
- C. Executive SummaryPages 25 - 34 Download chapter (PDF)
- a. „Beziehen“
- aa. Relatives Konzept der Identifizierbarkeit
- bb. Anforderungen an die heranzuziehenden Mittel
- cc. Mittelbarer Personenbezug oder Identifizierbarkeit
- dd. Relatives Konzept der Identifizierbarkeit in zeitlicher Hinsicht
- c. Zwischenergebnis
- a. Löschung von Merkmalen zur Identifizierung durch Auslassung oder Ersetzung
- b. Weitere Anonymisierungstechniken und Maßnahmen i.w.S.
- a. Typische identifizierende Merkmale
- aa. Berücksichtigung von weiteren Mitteln zur Identifizierung
- (1) Untersuchung auf Wortebene bzw. Zeichenebene
- (2) Untersuchung auf Entscheidungsebene – Cluster von Gerichtsentscheidungen
- cc. Training eines Sprachmodells als mögliche Anonymisierungstechnik
- c. Nach allgemeinem Ermessen wahrscheinlich genutzte Mittel
- d. Schlussfolgerungen für die Anwendung von Anonymisierungstechniken auf Gerichtsentscheidungen
- 1. Anwendbarkeit der Maßstäbe der DSGVO
- 2. Anonymisierungspraxis in Nordrhein-Westfalen bis zum Jahr 2021
- 3. Jüngere Anonymisierungspraxis in Nordrhein-Westfalen
- 4. Abgleich im Hinblick auf die Einhaltung der Anforderungen an die Anonymisierung unter der DSGVO
- a. Verwaltungsvorschrift als Rechtsgrundlage
- b. Veröffentlichung (teil-)anonymisierter Gerichtsentscheidungen gestützt auf Art. 6, 9 f. DSGVO
- c. Keine Haftungsprivilegierung nach Art. 4 ff. Digital Services Act
- d. Sonderregelung für die Aufsicht über die justizielle Tätigkeit
- e. Verschulden, Art. 82; Aufsichtsmaßnahmen, Art. 58 und 83 DSGVO
- 6. Zwischenergebnis
- 1. Einhaltung der Anonymisierungsanforderungen im Allgemeinen
- a. Veröffentlichung der bearbeiteten Gerichtsentscheidung
- aa. KI-Training als Anonymisierungsmaßnahme
- bb. Versehentliche Ausgabe von Trainingsdaten
- cc. Gezielte Extraktion von Trainingsdaten
- a. Training i.w.S.
- aa. Differenzierung zwischen Kennungen und sonstigen identifizierenden Merkmalen
- bb. Reichweite des Personenbezugs – Mischdatensätze
- (1) Dogmatische Bedenken mit Blick auf das Zusammenfallen einer Verarbeitung und der Heranziehung von Identifizierungsmitteln
- (2) Begünstigende Faktoren für eine Identifizierung
- (3) Vorbehalt der wahrscheinlichen Identifizierung nach allgemeinem Ermessen
- (1) Abstraktheit
- (2) Unsicherheit unter Berücksichtigung von Halluzinationen
- (1) Identifizierung im Zusammenhang mit der Speicherung
- (2) Aufbewahrung als Ausgangspunkt für eine Reproduktion
- ff. Zwischenergebnis
- 2. Verarbeitung durch Einsatz des Sprachmodells im Einzelfall
- a. Zurverfügungstellung des KI-Systems
- b. Veröffentlichung des trainierten Sprachmodells (Open Source)
- c. Veröffentlichung des Trainingskorpus (Open Source)
- 1. Relevante Verarbeitungen
- 2. Verhältnis zum mitgliedstaatlichen Recht
- a. Anforderungen
- aa. (Teilweise) Anonymisierung
- bb. KI-Training
- cc. Speicherung des KI-Modells
- dd. Einsatz des KI-Systems
- ee. Veröffentlichung des KI-Modells oder KI-Systems
- a. Einschränkungen aufgrund des Vorbehalts des Gesetzes (Art. 6 Abs. 1 UAbs. 2 DSGVO)
- b. Überblick über die Rechtsgrundlagen aus Art. 6 Abs. 1 UAbs. 1 DSGVO
- aa. (Teil-)Anonymisierung der Gerichtsentscheidungen
- bb. Weiterverarbeitung teilanonymisierter Entscheidungen: Training i.w.S., Speicherung und Einsatz des Sprachmodells
- cc. Veröffentlichung des Sprachmodells
- d. Art. 6 Abs. 1 UAbs. 1 lit. c DSGVO (rechtliche Pflicht)
- (1) Art. 6 Abs. 4 DSGVO als ergänzende Regelung
- (2) Art. 6 Abs. 4 DSGVO als eigenständige Rechtsgrundlage
- (3) Berücksichtigung der EuGH-Rechtsprechung
- (4) Zwischenergebnis
- (1) Rechtsvorschrift (Hs. 1)
- (2) Kompatibilitätstest (Hs. 2)
- cc. Schlussfolgerungen für das untersuchungsgegenständliche Projekt
- a. Relevanz für das untersuchungsgegenständliche Projekt
- aa. Art. 9 Abs. 2 lit. e DSGVO (offensichtliche Öffentlichmachung)
- bb. Art. 9 Abs. 2 lit. f DSGVO (Rechtsverteidigung und justizielle Tätigkeit der Gerichte)
- cc. Art. 9 Abs. 2 lit. g DSGVO (Öffnungsklausel für ein erhebliches öffentliches Interesse)
- dd. Art. 9 Abs. 2 lit. j DSGVO (wissenschaftliche Forschungszwecke)
- c. Personenbezogene Daten über strafrechtliche Verurteilungen und Straftaten (Art. 10 DSGVO)
- d. Verhältnis zu Anforderungen an die Zweckänderung (Art. 5 Abs. 1 lit. b, Art. 6 Abs. 4 DSGVO)
- e. Schlussfolgerungen für das untersuchungsgegenständliche Projekt
- a. Informationspflichten (Art. 13, 14 DSGVO)
- aa. Auskunft und Datenkopie (Art. 15 DSGVO)
- bb. Berichtigung und Mitteilungspflicht (Art. 16 und 19 DSGVO)
- cc. Löschung und Mitteilungspflicht (Art. 17 und 19 DSGVO), auch im Zusammenhang mit einem Widerspruch (Art. 21 DSGVO)
- dd. Einschränkung der Verarbeitung und Mitteilungspflicht (Art. 18 und 19 DSGVO)
- c. Datenschutzfolgenabschätzung und Pflicht zur Implementierung technischer und organisatorischer Maßnahmen
- d. Grundsatz der Speicherbegrenzung
- 7. Pflichten unter der JI-RL
- 8. Ergänzende Anforderungen mit Blick auf Eingabedaten
- 1. Inhalte von gerichtlichen Akten
- a. Kein Veröffentlichungsstandard
- b. Quantitativ: Recall
- c. Qualitativ: Clusterung
- 1. (Gemeinsame) Verantwortlichkeit der ausführenden Stellen
- aa. Art. 6 Abs. 1 UAbs. 1 lit. e, Abs. 2, 3 DSGVO i.V.m. Art. 5 Abs. 1 S. 1 Nr. 2 BayDSG bzw. § 8 Abs. 2 Nr. 2 DSG NRW
- bb. Art. 6 Abs. 1 UAbs. 1 lit. e, Abs. 3 DSGVO i.V.m. Art. 4 Abs. 1 BayDSG bzw. § 3 Abs. 1 DSG NRW
- cc. Art. 6 Abs. 1 UAbs. 1 lit. e, Abs. 3 DSGVO i.V.m. Hochschulgesetzen der Länder
- dd. Art. 6 Abs. 1 UAbs. 1 lit. e, Abs. 3 DSGVO i.V.m. § 17 Abs. 1 DSG NRW bzw. Art. 4 Abs. 1 BayDSG i.V.m. BayHIG oder Erst-Recht-Schluss aus Art. 8 Abs. 1 S. 1 Nr. 5 BayDSG i.V.m. Art. 6 Abs. 2 Nr. 3 lit. c BayDSG
- ee. Besonderheiten mit Blick auf besondere Kategorien personenbezogener Daten nach Art. 9 DSGVO
- b. Weiterverarbeitung durch die ausführenden Stellen
- 3. Datenschutzrechtliche Anforderungen im Übrigen
- 4. Zwischenergebnis
- 1. Datenschutzrechtliche Ausgangslage in drei Stufen: Anonymisierung – Rechtfertigung nach Art. 6 DSGVO – Rechtfertigung nach Art. 9, 10 DSGVO
- 2. Anforderungen an die Zusammenstellung des Trainingskorpus aus Gerichtsentscheidungen und Aktenauszügen (insbesondere Clusterung)
- 3. Anforderungen an das Anonymisierungstool (insbesondere Recall-Wert)
- 4. Anforderungen an das KI-System und dessen Einsatz (insbesondere System Prompt und Ausgabefilter)
- 5. Anforderungen an die Veröffentlichung des KI-Modells oder KI-Systems
- 6. Beachtung weiterer datenschutzrechtlicher Pflichten
- a. Schutz als Werk nach § 2 UrhG
- b. Kein Ausschluss nach § 5 Abs. 1 UrhG
- c. Verwandte Schutzrechte
- d. Zwischenergebnis
- 2. Aktenauszüge im Übrigen
- aa. Vervielfältigungen im Einzelnen
- bb. Vervielfältigung bei möglicher Rekonstruierbarkeit aus abgeleiteten Textformaten oder anhand eines Sprachmodells
- b. Einsatz und Ausgabe des KI-Systems
- c. Bearbeitungen des Werkes im Rahmen des Trainingsprozesses und des Einsatzes des KI-Systems
- d. Zwischenergebnis
- a. Nutzungsrechtseinräumungen
- b. Rechtspflege (§ 45 UrhG)
- aa. KI-Training als Text und Data Mining
- bb. KI-Einsatz und Ausgabe als Text und Data Mining
- (1) Intertemporale Anwendbarkeit
- (a) Form des Vorbehalts
- (b) Rechtsinhaber
- (c) Rechtmäßig zugängliche Werke
- (d) Weitere Anforderungen
- (3) Zwischenergebnis
- dd. Anwendbarkeit des § 60d UrhG
- d. Vorübergehende Vervielfältigungshandlungen (§ 44a UrhG)
- e. Zitate (§ 51 UrhG)
- f. Wissenschaftliche Forschung (§ 60c UrhG)
- 3. Einbindung weiterer Stellen
- 4. Ableitung von Einsatzbedingungen
- III. Besonderheiten bei der Veröffentlichung des Sprachmodells
- 1. Vervielfältigungen im Rahmen des GSJ-Projekts
- 2. Vervielfältigungen über das GSJ-Projekt hinaus
- 1. Anforderungen an die Zusammenstellung der Trainingsdaten
- 2. Anforderungen an das KI-System und dessen Einsatz
- 3. Anforderungen an die Veröffentlichung des Sprachmodells
- F. LiteraturverzeichnisPages 191 - 204 Download chapter (PDF)




