Skip to main content

Vor der Entwicklung jeder Voice App, wie eines Alexa Skills oder einer Google Action, steht die Definition einer Voice Persona. Dieser Begriff gehört zu denen, die man hört, ohne wirklich zu wissen, was genau sich dahinter verbirgt. Eine Voice Persona ist der Charakter einer Voice App.

Voice Persona: Mit wem sprechen wir?

Im Falle einer Voice-Only-Lösung haben Nutzer*innen nur die Worte, die der Smart Speaker oder Phonebot wiedergibt. Dieser Umstand hindert sie allerdings nicht daran, jeder Voice App eine eigene Persönlichkeit zuzuschreiben. Eine blinde Person, die jemanden kennenlernt, wird diesem Menschen immerhin auch anhand der Art und Weise wie er oder sie spricht, einen Charakter zuschreiben. Für die Voice Persona werden Attribute wie humorvoll, energiegeladen, seriös oder gelassen festgelegt. Wie genau man den Charakter definieren sollte, richtet sich vor allem nach der Zielgruppe. Je nachdem mit wem wir sprechen und in welcher Beziehung wir zu der Person stehen, reden wir unterschiedlich.

Die gewählten Eigenschaften von Alexa und Co. sollten zum Unternehmen und der Marke passen, da die Voice Persona diese für die Nutzer*innen repräsentiert. Ein Krankenhaus wird mit anderen Attributen assoziiert als ein Fashion-Shop. Für die Entwicklung hilft es, sich einen neuen Menschen auszudenken – eine Persona. Sind erst einmal die grundlegenden Fragen nach Geschlecht und Alter beantwortet, fällt es leichter dieser Person konkrete Eigenschaften zuzuschreiben. Auch die Vergabe eines Namens (und sei es nur für interne Zwecke) hilft bei der Formung eines neuen Charakters. Woran würden wir also eine fröhliche oder entspannte Person erkennen? Auf welche Art und Weise spricht jemand, der verlässlich ist, oder jemand Bodenständiges? Es fällt nun unter die Aufgaben eines/einer VUI-Designer*in die ausgewählten Eigenschaften mit den zur Verfügung stehenden sprachlichen Möglichkeiten umzusetzen. 

Auch Phonebots müssen die richtigen Worte finden

Die Wortwahl entscheidet maßgeblich über den Eindruck den wir von einer Person bekommen. Förmliche Formulierungen können professionell und kompetent wirken. Sie können allerdings auch dazu führen, dass eine gewisse Distanz zwischen der Voice Persona und den Nutzer*innen entsteht. Ein Spenden-Skill, der sich für eine Spende mit “Danke für deine Spende und das damit zusammenhängenden Engagement für den Artenschutz” bedankt, lässt das Unternehmen hinter dem Skill seriöser wirken als die Formulierung “Super, vielen Dank für deine Überweisung”.

Neben der Wortwahl sind auch die Verwendung von stilistischen Mitteln und die Satzlänge wichtig. Eine Voice App zur Meditation sollte möglichst kurze Sätze verwenden. Für Anwendungen, die kommunikativ wirken sollen, wie beispielsweise ein Phonebot einer Versicherungsgesellschaft, ist es von Vorteil etwas längere Sätze zu nutzen. Bei der Formulierung steht eines stets im Vordergrund: Es handelt sich um gesprochene Sprache. Sie soll spontan wirken. Selbst ein und dieselbe Person wird sich in gesprochener Sprache etwas anders ausdrücken als in geschriebener.

Der Ton macht die Voice Persona

Auch eine monotone Sprechweise wird mit anderen Eigenschaften verbunden als ein sehr abwechslungsreiches Stimmprofil. Die voreingestellten synthetischen Stimmen von den Marktführern Amazon und Google haben bereits einige Schritte in Richtung flexibler Betonungen gemacht. Für die deutsche Alexa Stimme ist es möglich die Lautstärke und Tonhöhe für Wörter zu verändern. Auch eine gezielte Betonung oder Regulierung der Sprechgeschwindigkeit ist in gewissem Maße möglich. Weitere prosodische Anpassungsmöglichkeiten sind seitens der Smart Speaker Hersteller stetig geplant. Für das Englische und Japanische ist bei Alexa bereits eine emotionale Aussprache von Äußerungen verfügbar.

Wenn die Emotionen der Nutzer*innen anhand der Stimme erkannt werden, kann sich der Bot damit zielgerichteter dieser Stimmung anpassen. Vor allem wenn eine Voice App sich an Kinder richtet oder grundsätzlich einen sehr lebhaften oder einfühlsamen Charakter vermitteln soll, bietet sich eine Anpassung der Aussprache an. Wenn nicht regelmäßig neue Inhalte hinzugefügt werden müssen, ist es auch eine Überlegung Wert, die Sätze von einem Sprecher oder einer Sprecherin professionell einsprechen zu lassen. Damit kann das Maximum an menschlicher Aussprache herausgeholt werden.

"Alexa, darf ich die Führung übernehmen?"

Wie auch mit menschlichen Gesprächspartnern, gibt es einige Personen, die dazu neigen das Gespräch zu leiten und andere, die einen stetigen Wechsel der beiden Teilnehmenden fordern. Je nach Funktionalität bietet sich die eine oder die andere Strategie an. Die Voice App eines Maklerbüros, die einen über verkäufliche Häuser informiert, sollte bei jedem Schritt Auswahlmöglichkeiten wie “Möchtest Du Dir Häuser mit oder ohne Keller ansehen?” bieten, anstatt eine Ja/Nein-Frage zu formulieren. Nutzer*innen könnten sich so in eine Richtung gedrängt fühlen. An den Grenzen der Spracherkennung gilt es ebenfalls den Charakter der Voice Persona zu beweisen. Entschuldigt sich die Voice App, wenn sie jemanden zum wiederholten Male nicht verstanden hat oder wird darauf mit einem Witz wie “Ich muss mir mal die Ohren putzen. Was hast du gesagt?” reagiert?

Wie wichtig ist eine Voice Persona?

Paul Watzlawicks Zitat “Man kann nicht nicht kommunizieren.” lässt sich auch auf Charaktere übertragen: Man kann nicht keinen Charakter haben. Selbst wenn sich ein Unternehmen gegen die gemeinsame Ausarbeitung einer Voice Persona entscheidet, werden Nutzer*innen der Voice App einen Charakter zuschreiben. Dieser Charakter kann langweilig oder unstet wirken und im schlechtesten Fall von dem Bild und den Attributen des Unternehmens abweichen. Mit überlegter Wortwahl, Prosodie und Dialogführung ist es also durchaus möglich einprägsame Charaktere zu schaffen, die sich trotz der voreingestellten Stimmen der Hersteller von Anwendung zu Anwendung unterscheiden.

Das Ziel ist es jedoch, die eigentliche Funktionalität mit einem authentischen Charakter zu unterstützen ohne die Anwendung künstlich in die Länge zu ziehen und von der eigentlichen Funktion abzulenken. Der Mehrwert einer ausgearbeiteten Voice Persona liegt in der Nutzerfreundlichkeit und Erinnerungsfähigkeit der Voice App und damit der Marke selbst. Die Frage “Mit wem spreche ich eigentlich?” sollten sich nicht die Nutzer*innen, sondern das Unternehmen stellen.

Ihr benötigt Hilfe bei der Entwicklung Eurer Voice Persona? Sprecht uns gerne an! Gemeinsam finden wir die perfekte Lösung für Euch.

Vanessa Smolik

Als eine Mischung aus Computer- und Psycholinguistin vereint Vanessa gleichermaßen das Verständnis für die Magie hinter automatischer Spracherkennung und dem sprachlichen Verhalten von Menschen.