Universität Bielefeld - Sonderforschungsbereich 360

LaU - Label- und Testumgebung für
melodische Aspekte gesprochener Sprache

Christel Brindöpke und Arno Pahde

Einleitung

LaU ist ein multifunktionales Werkzeug, das insbesondere auf drei Arbeitsfelder prosodischer Forschung abgestimmt ist. Diese drei Felder betreffen die melodische Annotierung von Sprachsignalen, Vorarbeiten zur Entwicklung melodischer Kategorien und die Generierung von Sprachsignalen mit kontrollierten melodischen Parametern für empirische Untersuchungen (z.B. Akzeptanztests).

LaU unterst&uumnl;tzt die melodische Signalannotierung durch ein akustisches und visuelles Feedback (d.h. ein mit den melodischen Labeln reynthesiertes Sprachsignal, berechnete Grundfrequenz als Overlay über die ursprüngliche F0-Kontur), mit dessen Hilfe die melodische Annotierung überprüft und schrittweise verfeinert werden kann. Insbesondere durch die unmittelbare akustische Überprüfbarkeit der melodischen Annotierung wird deren Intersubjektivität gewährleistet. Für das Deutsche unterstützt LaU eine modellbasierte melodische Beschreibung nach Adriaens (1991). Die modellbasierte melodische Beschreibung des Deutschen (Abschnitt 2) beinhaltet lokale und globale melodische Charakterika. Die globale melodische Beschreibung (Deklination) kann entweder nach Adriaens (1991) erfolgen oder modellunabhängig (Abschnitt 2.2, 2.3.3, 2.3.4).

Zur Bildung neuer melodischer Kategorien bietet LaU die Möglichkeit, F0-Konturen durch benutzerdefinierte Geraden (in Hertz- bzw. Halbtonwerten) anzunähern. Die auditive Überprüfbarkeit der Annäherung erfolgt wie schon bei der modellbasierten melodischen Annotierung durch Resynthese des ursprünglichen Sprachsignals mit den neuen Grundfrequenzwerten. Eine visuelle Überprüfbarkeit erfolgt durch die Ausgabe der berechneten Grundfrequenzkontur als Overlay über die ursprüngliche F0-Kontur. Weitere Analysen von Position und Umfang häufig auftretender Geradensegmente bilden dann die Grundlage der Definition neuer melodischer Kategorien der jeweiligen Zielsprache.

Für die Generierung von Sprachsignalen mit kontrollierten melodischen Parametern können beide Arten der unter LaU angebotenen melodischen Beschreibung eingesetzt werden (benutzerdefinierte Geraden, modellbasierte melodische Kategorien).

Die Realisierung der Labelumgebung erfolgte unter der weit verbreiteten Signalverarbeitungssoftware ESPS/XWaves. Zum einen bietet XWaves über die Programme xlabel und xchart komfortable Möglichkeiten zu labeln ohne eine Festlegung auf bestimmte Modelle und zum anderen ermöglicht ESPS/XWaves die Einbindung von C-Programmen über Shellskripte, so daß die Definition einer individuellen Labelumgebung, die optimal auf die Bedürfnisse des jeweiligen Nutzers abgestimmt ist, verhätnismäßig einfach ist. Dementsprechend besteht LaU aus C-Programmen und Shellskripten, die in XWaves eingebunden sind. Dadurch können weitere Aspekte prosodischer Signalannotierung, die eher die zeitliche und lautliche Strukturierung des Signals betreffen (z.B. orthographische und phonemische Umschrift, prosodische Grenzen, ergänzende syntaktische, semantische oder pragmatische Informationen) ohne weiteres einbezogen werden. In den folgenden Abschnitten werden Konzepte und Realisierung der Labelumgebung näher erläutert. Abschnitt 2 beschreibt zum einen theorische Aspekte der modellbasierten melodischen Sprachbeschreiubng und zum anderen die Aspekte, die die Berechnung (Abschnitt 2.3) betreffen. In Abschnitt 3 wird die modellunabhängige melodische Beschreibung und in Abschnitt 4 das eingesetzte Resynthese-Verfahren erläutert. Abschnitt 5 beschreibt einige Utilities der Labelumgebung und Abschnitt 6 enthält nähere Informationen über die Realisierung der Labelumgebung. Hinweise zur praktischen Bedienung der Labelumgebung finden sich in grau unterlegten Kästen innerhalb des Fließtextes. Im Anhang A ist ein Überblick über die z.Zt. verwendbaren melodischen Label, deren Definition und die zulässige melodische Grammatik des Deutschen enthalten. Eine Kurzübersicht über alle Programme der Labelumgebung und ihre Funktionen findet sich in Abschnitt 6.3.


Postscript-File (~105 k)
Anke Weinberger, 1997-04-25, 1997-06-24