Linguistisches Wissen zur automatischen Lexikon-Akquisition aus deutschen Textcorpora
Judith Eckle-Kohler
ISBN 978-3-89722-301-1
402 pages, year of publication: 1999
price: 40.00 €
Automatischen Verfahren zur Lexikon-Akquisition gilt schon seit einigen
Jahren ein besonderes Forschungsinteresse, da lexikalische Ressourcen bei
einer Vielzahl von Systemen zur maschinellen Sprachverarbeitung eine
wichtige Rolle spielen und der Aufwand für den manuellen Aufbau solcher
Ressourcen sehr hoch ist.
Systeme, die beispielsweise für die maschinelle Übersetzung eingesetzt
werden, sollten idealerweise den Inhalt eines gegebenen Textes erfassen
können. Voraussetzung für die automatische Erfassung des Inhalts eines
Textes ist jedoch dessen vollständige syntaktische Analyse, die nur dann
durchgeführt werden kann, wenn ein maschinenlesbares syntaktisches Lexikon
mit detaillierten Angaben zu Subkategorisierungseigenschaften zur
Verfügung steht.
Die vorliegende Arbeit beschreibt linguistisches Wissen und darauf aufbauende
Verfahren zur automatischen Akquisition von Subkategorisierungsrahmen
deutscher Verben aus
Textcorpora, die für den halbautomatischen Aufbau eines
Subkategorisierungslexikons mit Angaben zu 6305 Verblemmata und 244
Subkategorisierungsrahmen eingesetzt worden sind.
Für Verben mit satzförmigen Komplementen wird gezeigt, wie fehlende
Subkategorisierungsrahmen in einem Subkategorisierungslexikon mit Hilfe automatisch anwendbarer, auf Subkategorisierungsalternationen basierender, linguistischer
Regeln ergänzt werden können.