Studien zur Mustererkennung , Bd. 9
Automatische Sprachverarbeitungssysteme wie zum Beispiel der VERBMOBIL-Prototyp verwenden unterschiedliche Wissensquellen meist nur sequentiell. Auf diese Weise wird jede Wissensquelle nur für sich betrachtet. Fehlklassifikationen einer Wissensquelle können meist durch die im nächsten Schritt eingesetzte Wissensquelle nicht wieder rückgängig gemacht werden. Der Grund für den Einsatz von sequentiell arbeitenden automatischen Sprachsystemen liegt darin, dass sie sehr schnell und effizient implementiert werden können. Das Modul zur Dialogakt-Segmentierung und -Klassifikation, welches im VERBMOBIL-Prototypen eingesetzt wird, arbeitet auch sequentiell.
Während der Laufzeit des VERBMOBIL-Projekts wurde nun untersucht, wie sich die verschiedenen Wissensquellen in einem Klassifikationsschritt verwenden lassen. Um dies zu erreichen mussten die Klassifikatoren für die Wissensquellen Lexikon, Prosody, Symbolfolgen und Grammatik so verändert werden, dass sie Hypothesen für Äußerungsgrenzen und Dialogakte produzieren. Diese Hypothesen werden dann bewertet und es wird der besten Pfad durch den so aufgespannten Graphen mit Hilfe des A*-Algorithmus gesucht. Die Restkosten, die für eine effiziente A*-Suche benötigt werden, können mit Hilfe des Viterbi-Algorithmus berechnet werden.
Die wichtigsten Ergebnisse dieser Arbeit sind, dass der neue integrierte Ansatz zur Segmentierung und Klassifikation von Dialogakten 7.6% Punkte (insgesamt 69.3%) besser in Precision und Recall ist als der sequentielle Ansatz und dass die Dialogaktakkuratheit um 7.3% Punkte (insgesamt 60.1%) höher ist, wenn man 18 verschiedene Dialogakte betrachtet. Dabei ist zu beachten, dass beide Ansätze, der sequentielle und der integrierte, die gleichen Wissensquellen und Klassifikatoren verwenden. Es zeigt sich daher, dass der integrierte Ansatz für die Segmentierung und Klassifikation von Dialogakten dem sequentiellen überlegen ist.
40.50 € | ||
only 3 in stock |