Skip to main content

Bei Smart Speakern oder Voicebots heißt es: Sprechen statt Tippen! Und das funktioniert nur dank sogenannter Voice User Interfaces (VUI). Was darunter genau zu verstehen ist und welche Besonderheiten und Herausforderungen Sprache mit sich bringt, erklären wir in diesem Blogpost.

Voice User Interface Definition

Voice User Interfaces sind Benutzer-Schnittstellen für Anwendungen, die auf Sprachsteuerung basieren. Statt über Klicks, Swipes und Co. nehmen VUIs Benutzereingaben nämlich über Sprachbefehle entgegen. Also: ohne VUI könnten Nutzer:innen nicht mit dem jeweiligen Voicebot oder Smart Speaker kommunizieren. Ein prominentes Beispiel für Voice User Interfaces sind Sprachassistent:innen wie Amazon Alexa oder Siri von Apple.

Damit der Bot uns versteht und uns antworten kann, laufen im Hintergrund einige sehr komplexe Technologien ab, die wir in den Artikeln „Wie funktioniert ein Voicebot?” und „Wie funktioniert Sprachverarbeitung?” genauer erläutern.

Um zu verstehen, wie ein Voice User Interface funktioniert, hilft es vielleicht, sich erst einmal vor Augen zu führen, was ein Graphical User Interface (GUI) ist. Ein GUI hilft Nutzenden sich beispielsweise auf einer Homepage zurecht zu finden. GUI-Designer:innen überlegen dabei, wo ein Drop-Down-Menü Sinn macht, wo welcher Reiter hingehört, etc.

Analog dazu führt ein VUI Nutzende durch eine sprachbasierte Anwendung. Die Unterschiede in der Art und Weise, wie Nutzende sprechen, wie sie Sätze formulieren oder Wörter wählen, sind eine Herausforderung für die Konzeption eines Voice User Interfaces. Dazu kommt noch, dass Nutzende auch ohne Display wissen müssen, wo im System sie sich gerade befinden, wie sie möglicherweise zurückkommen und welche Befehle überhaupt ausgeführt werden können.

Gar nicht so einfach, oder? Deshalb haben wir einige erfahrene VUI-Designer:innen an Board, die Voice User Interfaces entwickeln. Wie man zu diesem speziellen Beruf kommt und welche Aufgaben genau dazugehören, kannst Du hier nachlesen.

Besonderheiten und Herausforderungen von Sprache und VUIs

Unsere natürliche Sprache ist flexibel, mehrdeutig und individuell nutzbar. Die Frage „Wann ist mein nächster Termin?“ hat in etwa die gleiche Intention, wie die Frage „Habe ich heute noch etwas vor?“. Dahingegen meinen die Sätze “Wie male ich Mehl?” oder “Wie mahle ich Mehl” etwas komplett anderes.

Durch diese Flexibilität gibt es beim VUI weniger etablierte Standards in der Frontendgestaltung als beim GUI. Denn hier hat jeder Button eine feste Bedeutung. Das ist bei Sprache nicht immer so eindeutig. Einige VUI-Systeme setzen deshalb darauf, den User:innen durch Auswahlfragen – also geschlossene Fragen zu stellen. Nutzende mit zehn Optionen zu konfrontieren ist allerdings genauso ungünstig, wie zu wenig Möglichkeiten zur Verfügung zu stellen. Bis alle Varianten aufgesagt sind, hat der User die ersten bereits vergessen. Für andere VUI-Systeme gilt es wiederum eine offene Art der Interaktion zu kreieren, die User:innen nicht auf die Nutzung einiger weniger Befehle limitiert, sondern eine lebendige Konversation herstellt. Die Nutzenden können ihre Fragen oder Anliegen also frei formulieren. Ob sich eine offene oder Auswahlfrage besser eignet, hängt vom konkreten Anwendungsfall ab. Mehr dazu erklären wie in diesem Blogpost.

Es gilt also, sich im Vorfeld genau zu überlegen, welchem Zweck die Sprachanwendung dient und das VUI dahingehend optimal zu entwickeln. Was zeichnet die Nutzenden der Anwendung aus? Welches Problem oder Anliegen soll gelöst werden? Soll beispielsweise eine Anliegenerkennung durchgeführt, Anrufende identifiziert oder ein eigener Voice-Skill entwickelt werden?

Daraus ergeben sich dann die weiteren Projektschritte wie beispielsweise Dialogentwicklung, technische Implementierung, Testing und schließlich der Go Live.

Bist Du bereit für Voice? Ob einen Phonebot für die ERGO Versicherung oder Alexa-Skills für DER SPIEGEL, das DRK oder Vodafone – wir haben bereits zahlreiche großartige Projekte umsetzen. Bist du bereit mit Voice durchzustarten? Nimm jetzt Kontakt zu uns auf.

Jannika Kraus

Jannika unterstützt Future of Voice als Werkstudentin im Bereich Content Marketing.