Book Description: Richard Huber : Prosodisch-linguistische Klassifikation von Emotion, Reihe: Studien zur Mustererkennung, Bd. 8

Logos Verlag Berlin – Academic Publications in Science and Humanities

Logos Verlag Berlin
Academic Publications in Science and Humanities

MENÜ

cover

Prosodisch-linguistische Klassifikation von Emotion

Studien zur Mustererkennung , Bd. 8

Richard Huber

ISBN 978-3-89722-984-6
293 pages, year of publication: 2002
price: 40.50 €

Emotionen spielen in der zwischenmenschlichen Kommunikation eine wesentliche Rolle. Der Mensch vermittelt seiner Umwelt seine Emotionen bewusst und unbewusst, über seine Stimme, Mimik, Gestik und durch Kombinationen dieser Mittel. Zu den Emotionen zählen dabei z.B. Freude, Traurigkeit, Ärger oder Frustration.

Diese Arbeit beschränkt sich auf die maschinelle Klassifikation von Emotion in gesprochener Sprache, d.h. Merkmale aus Mimik und Gestik werden nicht berücksichtigt.

Ein Anwendungsgebiet für einen derartigen Emotionsklassifikator ist z.B. die Verbesserung automatischer Dialogsysteme. Das automatische Dialogsystem wird um diese Komponente erweitert und ist dann in der Lage den emotionalen Zustand des Anwenders zu bestimmen. Wird dieser zusehends verärgert, z.B. weil das automatische System mehrfach falsch versteht und dadurch der Dialog fehl schlägt, kann dies das automatische System erkennen und geeignete Maßnahmen ergreifen. Zu diesen Maßnahmen gehört z.B. die Initialisierung eines Klärungsdialogs oder auch das übergeben an einen menschlichen Call-Center-Agenten.

In diesem Zusammenhang spielen Emotionen wie Freude und Traurigkeit eher eine untergeordnete Rolle. In dieser Arbeit wird daher unter dem Begriff "Emotion" das Auftreten von Ärger bzw. Frustration oder allgemein das Vorhandensein eines "Kommunikationsproblems" zwischen Mensch und Maschine verstanden. Als Klassifikator wird in der vorliegenden Arbeit der Formalismus der künstlichen neuronalen Netze verwendet. Für die Klassifikation der Emotion werden verschiedene prosodisch-linguistische Merkmalsätze verwendet, auf deren Berechnung detailliert eingegangen wird. Als prosodische Merkmale werden z.B. Grundfrequenz- und Energieverläufe und die Längen von Pausen und gesprochenen Wörtern innerhalb verschiedener Analysefenster verwendet. Als linguistische Merkmale dienen Wortklassen, verschiedene Dialogakte und das Auftreten von Wiederholungen und Reformulierungen innerhalb der Dialoge.

Für die einzelnen Experimente stehen dabei zwei verschiedene Aufnahmeszenarien zur Verfügung. Zum Einen werden Klassifikationsexperimente unter der Verwendung von Schauspieldaten vorgestellt. Als Schauspieldaten werden dabei Aufnahmen bezeichnet, bei denen den Testpersonen einige wenige Äußerungen vorgegeben sind, die sowohl ärgerlich als auch neutral zu sprechen sind. Dabei wird der Ärger nur simuliert. Da diese Daten in der Regel stark von den Daten abweichen, die in einer realen Anwendung vorliegen, werden zum Anderen Aufnahmen von sogenannten Wizard-of-Oz-Experimenten verwendet. Bei diesen Experimenten hat jede Testperson die Aufgabe, mit einem vermeintlich automatischem Dialogsystem innerhalb von 20 Minuten an Hand eines Terminkalenders zehn Termine zu vereinbaren. Tatsächlich werden die einzelnen Dialoge zwischen den Testpersonen und dem System von einem Versuchsleiter gesteuert. Das Ziel dabei ist, die Testperson durch gezielte Verwendung von unsinnigen Systemäußerungen oder absichtlichem Falschverstehen zu emotionalen Äußerungen zu verleiten. Das Verhalten des Dialogsystems ist dem eines realen Systems vergleichbar, so dass die erhaltenen Aufnahmen im Vergleich zu den Aufnahmen mit rein simulierter Emotion eher denen einer realen Anwendung entsprechen.

Es werden verschiedene Klassifikationsexperimente unter Verwendung der unterschiedlichen Merkmalsätze und der beiden Aufnahmeszenarien vorgestellt und die einzelnen Ergebnisse werden miteinander verglichen und kritisch beurteilt.

Keywords: