Klassifikation deutscher rechtlicher Texte

Gerfördert durch

 

Förderkennzeichen: 16KN063732

Motivation

Rechtliche Texte sind für Nicht-Juristen oft nur schwer verständlich. Trozdem ist der Umgang mit rechtlichen Texten für viele alltäglich. Wir untersuchen ob es möglich ist vordefinierte Informationen aus Verträgen zu extrahieren. Darauf aufbauend sollen Textpassagen hinsichtlich ihrer Relevanz klassifiziert werden.

Forschungsbereiche

Domänenspezifischer NLP Prozess

Die Vielseitigkeit natürlicher Sprache mach die autromatisierte Verarbeitung zu einer großen Herausforderung. Im Umfeld des Natural Language Prozessing (NLP) hat sich ein variabler Prozess mit verschiedenen Stufen etabliert. Die einzelnen Stufen lassen sich als Klassifikationsprobleme beschreiben.

Ein Ziel dieses Projektes ist es mit State-of-the-Art Ansätze auf deutsche rechtliche Texte anzuwenden.

Information Extraction

Aufbauend aus einem NLP Prozess werden strukturioerte Informationen aus dem Unstrukturierten Text extrahiert.

Dabei wird versucht im Text erkannte Entitäten als Instanz einer Anwenderspezifischen Ontologie abzubilden.

Menü schließen