, to see if you have full access to this publication.
Book Titles No access
Automatisierte Erkennung von Standardisierung und Variation in juristischen Texten
- Authors:
- Series:
- Computational and Quantitative Methods in Law | Computergestützte und quantitative Methoden im Recht, Volume 3
- Publisher:
- 2023
Summary
This paper describes a method developed for the automated analysis of legal documents. The technical procedure is based on proven methods from computational linguistics and machine learning. The motivation underlying this work is the improvement of support systems for legal text production and the development of an automated approach in the approval process of legal writings e.g. contracts. The procedure for automated text analysis is intended to contribute to a time reduction of the process and to the improvement of quality in the approval procedure.
Keywords
Search publication
Bibliographic data
- Copyright year
- 2023
- ISBN-Print
- 978-3-7560-0085-2
- ISBN-Online
- 978-3-7489-1495-2
- Publisher
- Nomos, Baden-Baden
- Series
- Computational and Quantitative Methods in Law | Computergestützte und quantitative Methoden im Recht
- Volume
- 3
- Language
- German
- Pages
- 343
- Product type
- Book Titles
Table of contents
ChapterPages
- Titelei/Inhaltsverzeichnis No access Pages 1 - 28
- Forschungsfrage No access
- Juristische Fachtextsorten und Korpora No access
- Strukturanalyse von PDF-Dokumenten No access
- Linguistische Phänomene in juristischen Fachtextsorten No access
- Methodenentwicklung: Variationen von juristischen Textabschnitten No access
- Evaluation und Bewertung der Nützlichkeit No access
- Zusammenfassung der Aufgabenstellungen No access
- Distanz- und Ähnlichkeitsmaße No access
- Gütemaße No access
- Sequenzanalyse (Apriori-Algorithmus) No access
- Repräsentation als Graph No access
- Eigene Begriffsdefinitionen No access
- Kapitelstruktur der Arbeit No access
- Fachtextsorten und Konventionen in der juristischen Fachsprache No access
- Sprachliche Phänomene der juristischen Fachsprache No access
- Korpuslinguistik No access
- Strukturanalyse und Rekonstruktion der Dokumentstruktur No access
- Dokumentkonvertierung (von PDF nach XML) No access
- Extraktion von benannten Entitäten und Einsatz von Suchfunktionen No access
- Wiederverwendung von Texten und Plagiatserkennung No access
- Dokumentähnlichkeit, Textähnlichkeit und Identifizierung von Musterformulierungen No access
- Technologien des Machine Learning (ML) zur Erstellung, Verwaltung und Analyse von juristischem Textmaterial No access
- Deep-Learning-Ansätze No access
- Erklärbarkeit von ML-Modellen No access
- Extraktion von Text aus PDF-Dokumenten No access
- Wiederverwendung von Text und Plagiatserkennung No access
- Legal-Tech-Anwendungen No access
- Verwandte Arbeiten No access
- Methodik und eigener Forschungsbeitrag No access
- Visualisierung des Entwicklungsprozesses No access
- Textfunktion No access
- Fachtextsorten der Korpora No access
- Sprachliche Charakteristika von juristischen Fachtextsorten No access
- Übersicht und Beschreibungen der Korpora No access
- Korpusdesign JurK-Verträge-HR-P No access
- Korpusdesign JurK-Verträge-P No access
- Korpusdesign JurK-Urteile-H No access
- Korpusdesign JurK-Verträge-AGB-P No access
- Korpusdesign JurK-Segmentierung-P No access
- Korpusdesign JurK-Cyber-HR-P No access
- Korpusdesign JurK-Cyber-HR-T No access
- Linguistische Beschreibungen der Korpora No access
- Zusammenfassung: Korpora und linguistische Betrachtungen No access
- Mikrotypografie No access
- Mesotypografie No access
- Makrotypografie No access
- Ergänzende typografische und quantitative Merkmale No access
- Beschreibung der Dokumente für die Entwicklung der Strukturanalyse No access
- Extraktion der typografischen Merkmale aus den Vertragsdokumenten No access
- Extrahierte Merkmale der Textelemente No access
- Extrahierte und berechnete Merkmale für das Seitenlayout No access
- Datensatz für die Klassifizierung von Seitenlayout und Textstrukturklassen No access
- Identifikation der optimalen Markeranzahl No access
- Seitenlayout-Analyse mit einem Clustering-Verfahren No access
- Seitenlayout-Identifikation mit einem Convolutional Neural Network No access
- Merkmale der Textstrukturelemente No access
- Klassifizierung der Textelemente No access
- Fazit der Strukturanalyse No access
- Untersuchung zur vektorbasierten Ähnlichkeit von Überschriften No access
- Identifizierung von Musterklauselüberschriften No access
- Abgleich der Klauselinhalte No access
- Analyse und Visualisierung der Änderungen in den Klauseln No access
- Analyse der Ersetzungen in den Änderungen No access
- Fehlerquellen der layoutbasierten Analyse von Vertragsbestandteilen No access
- Zusammenfassung No access
- Methodenübernahme aus Layout- und Strukturanalyse No access
- Textextraktion No access
- Dublettenerkennung No access
- Wissensquelle Wortliste für Korrektur von OCR-Fehlern und getrennten Wörtern No access
- Wissensquelle Korrekturliste für Korrektur von OCR-Fehlern No access
- Bereinigung von Worttrennungen No access
- Erkennung von Satzgrenzen in juristischen Texten No access
- Filtern und Vereinfachen No access
- Ähnlichkeit und Schwellenwerte für Clusterbildung No access
- Ergebnisse für Cluster von ähnlichen Sätzen No access
- Zusammenfassung: Übernahme der Satzcluster für das IrS-Verfahren No access
- Einführung zum IrS-Verfahren No access
- Clusterbildung der Sätze No access
- Sequenzmuster No access
- Zusammengefasste Sequenzmuster No access
- Satzfolgen einer exakten Sequenzsuche No access
- Ergebnisse für Textabschnitte aus dem IrS-Verfahren No access
- Satzfolgen einer toleranten Sequenzsuche No access
- Mögliche Erweiterung im IrS-Verfahren: Einsatz von häufig vorkommenden Satzclustern No access
- Stufen der Generalisierbarkeit und Variabilität No access
- Graphenbasierte Darstellung der Textabschnitte No access
- Variabilität in den Textabschnitten No access
- Umfang der identifizierten musterhaften Textabschnitte No access
- Zusammenfassung: Standardisierung und Variation No access
- Auswahl und Einsatz der entwickelten Verfahren für die Bewertung No access
- Überblick über eingesetzte Experimente No access
- Experimentelles Design No access
- Ergebnisse und interne Einschätzung der Verfahrensgrenzen (Exp_Grenzen) No access
- Internes Experiment mit Cyber-Bedingungen (Exp_Intern) No access
- Ergebnisse von Exp_Intern No access
- Interne Einschätzung von Exp_Intern No access
- Annotation der Variabilitätsklassen durch Fachpersonal (Exp_4_3_Extern) No access
- Durchführung der externen Annotation No access
- Meta-Evaluation für den Vergleich und Auswertung der Annotationen Exp_Meta-Evaluation No access
- Aufbau der Befragung und Durchführung No access
- Ergebnisse und externes Fazit No access
- Verifikation der Evaluationsannahmen No access
- Zusammenfassung: Evaluation No access
- Limitationen aufgrund des Dokumentformats und der -qualität No access
- Limitationen aufgrund der Textsorten No access
- Limitationen der NLP-Methoden No access
- Clusterbildung der Sätze No access
- Sequenzmuster No access
- Identifikation der Fundstellen von Sequenzmustern im Korpus No access
- Visualisierung der Textabschnittsvarianten No access
- Limitationen der eingesetzten externen Software und Methoden No access
- Korpuserstellung, Textextraktion und linguistische Vorverarbeitung No access
- Methodenentwicklung No access
- Beitrag zu Berechnung von Textähnlichkeit No access
- Evaluation und Bewertung der Nützlichkeit No access
- Funktion: Analyse identifizierter Textabschnitte No access
- Funktion: Erfahrungsdatenbank mit Textabschnittsvarianten No access
- Funktion: Textabschnitte als Relation zwischen Dokumenten No access
- Funktion: Einsatz in Genehmigungsverfahren von Verträgen No access
- Anwendung: Analyse von Rückversicherungsverträgen No access
- Anwendung: Identifikation von neuen Vertragsinhalten No access
- Anwendung: Erstellung von gültigen juristischen Dokumenten No access
- Adaption: Verarbeitungspipeline für PDF-Dokumente No access
- Adaption: IrS-Verfahren für andere Fachtextsorten No access
- Abschließende Betrachtung No access
- Literaturverzeichnis No access Pages 319 - 332
- Quellen der Dokumente für den Aufbau der Korpora No access
- Quellen für die Erstellung der Wortliste No access
- Wikipedia-Kategorien für die Erstellung der Wortliste No access
- Stoppwörter No access
- Liste mit geschützten Abkürzungen No access
- Quellen für die Experimente der internen und externen Evaluationen No access
- Leitfaden für das Experteninterview No access
- Wortindex No access Pages 341 - 343





