MENÜ MENÜ  

cover

Integrierte Segmentierung und Klassifikation von Äußerungen und Dialogakten mit heterogenen Wissensquellen

Studien zur Mustererkennung , Bd. 9

Volker Warnke

ISBN 978-3-8325-0254-6
182 pages, year of publication: 2003
price: 40.50 €
Diese Arbeit befasst sich mit dem Thema integrierte Segmentierung und Klassifikation von Dialogakten und Äußerungen mit heterogenen Wissensquellen und wurde innerhalb des VERBMOBIL-II-Projekts durchgeführt. Der VERBMOBIL-Prototyp ist in der Lage Gespräche aus dem Bereich Terminvereinbarung und Hotelreservierung aus den drei Quellsprachen englisch, deutsch und japanisch in eine der Zielsprachen (ebenfalls englisch, deutsch und japanisch) zu übersetzen. Die Übersetzung erfolgt dabei in verschiedenen Strängen, in denen unterschiedliche Wissensquellen und Algorithmen eingesetzt werden. Ein solcher Übersetzungsstrang ist die dialogaktbasierte Übersetzung. Zuerst wird ein Redebeitrag in Äußerungen segmentiert und anschließend wird jeder Äußerung ein Dialogakt zugewiesen. Diese können dann mit Hilfe von vordefinierten Schablonen übersetzt werden.

Automatische Sprachverarbeitungssysteme wie zum Beispiel der VERBMOBIL-Prototyp verwenden unterschiedliche Wissensquellen meist nur sequentiell. Auf diese Weise wird jede Wissensquelle nur für sich betrachtet. Fehlklassifikationen einer Wissensquelle können meist durch die im nächsten Schritt eingesetzte Wissensquelle nicht wieder rückgängig gemacht werden. Der Grund für den Einsatz von sequentiell arbeitenden automatischen Sprachsystemen liegt darin, dass sie sehr schnell und effizient implementiert werden können. Das Modul zur Dialogakt-Segmentierung und -Klassifikation, welches im VERBMOBIL-Prototypen eingesetzt wird, arbeitet auch sequentiell.

Während der Laufzeit des VERBMOBIL-Projekts wurde nun untersucht, wie sich die verschiedenen Wissensquellen in einem Klassifikationsschritt verwenden lassen. Um dies zu erreichen mussten die Klassifikatoren für die Wissensquellen Lexikon, Prosody, Symbolfolgen und Grammatik so verändert werden, dass sie Hypothesen für Äußerungsgrenzen und Dialogakte produzieren. Diese Hypothesen werden dann bewertet und es wird der besten Pfad durch den so aufgespannten Graphen mit Hilfe des A*-Algorithmus gesucht. Die Restkosten, die für eine effiziente A*-Suche benötigt werden, können mit Hilfe des Viterbi-Algorithmus berechnet werden.

Die wichtigsten Ergebnisse dieser Arbeit sind, dass der neue integrierte Ansatz zur Segmentierung und Klassifikation von Dialogakten 7.6% Punkte (insgesamt 69.3%) besser in Precision und Recall ist als der sequentielle Ansatz und dass die Dialogaktakkuratheit um 7.3% Punkte (insgesamt 60.1%) höher ist, wenn man 18 verschiedene Dialogakte betrachtet. Dabei ist zu beachten, dass beide Ansätze, der sequentielle und der integrierte, die gleichen Wissensquellen und Klassifikatoren verwenden. Es zeigt sich daher, dass der integrierte Ansatz für die Segmentierung und Klassifikation von Dialogakten dem sequentiellen überlegen ist.

Keywords:

Buying Options

40.50 €