Skip to main content

Bis jetzt ähnelt die Interaktion mit Alexa eher einzelnen Befehlen, als einer richtigen Unterhaltung – das soll sich mit dem neuen Konversationsmodus ändern. Durch die neue Funktion kann Alexa längere und weniger umständlichere Gespräche führen und Unterbrechungen besser verarbeiten. Damit geht Amazon den ersten Schritt Richtung natürliche Unterhaltung.

Was ist der Konversationsmodus?

Normalerweise wecken Benutzer*innen die digitalen Helfer*innen mit sogenannten Aktivierungsworten, wie „Hey Alexa“ oder „Hey Siri“ – dadurch beginnt die Konversation ziemlich roboterhaft. Durch den Konversationsmodus soll der Austausch einer normalen Konversation ähneln, bei der Nutzer*innen nicht immer den Namen einer Person verwenden, mit der sie sprechen. Das Feature wurde bereits im Herbst 2020 angekündigt, jetzt ist der Konversationsmodus endlich für das Echo Show 10 der dritten Generation verfügbar – bisher allerdings nur in den USA.

Mit der Aufforderung „Alexa, tritt dem Gespräch bei“ kann jeder im Raum mit der digitalen Assistentin sprechen, ohne das Aktivierungswort zu wiederholen. Alexa hört auch noch zu, wenn das Gespräch eigentlich für sie beendet ist und keine Frage mehr gestellt wurde – denn bei einer natürlichen Konversation gibt es kein festgelegtes Ende. Natürlich bleibt Alexa nicht für immer im Konversationsmodus. Nachdem Nutzer*innen Alexa auffordern, das Gespräch wieder zu verlassen oder längere Zeit keine Interaktion stattgefunden hat, wird der Modus wieder beendet.

Mit dem neuen Feature kann Alexa außerdem besser mit kontextbasierten Unterbrechungen umgehen. Wenn Nutzer*innen den Smart Speaker unterbrechen und eine neue Anfrage stellen, (z.B. „Zeige mir stattdessen italienische Restaurants“), weiß Alexa, dass sie aufhören soll zu sprechen und fährt mit der Bearbeitung der neuen Anfrage fort. In einigen Fällen muss die digitale Assistentin auch wissen, wie weit sie mit der Ausgabe gekommen ist. Wenn Alexa zum Beispiel nach einer Kundenanfrage eine Liste mit Optionen zurückgibt und der Kunde unterbricht, um zu sagen: „Diese eine“, weiß Alexa, dass sich „diese“ auf die Option bezieht, die sie zum Zeitpunkt der Unterbrechung vorgelesen hat.

Alexa Konversationsmodus in der Praxis

Als der Konversationsmodus im Herbst 2020 zum ersten Mal vorgestellt wurde, hat Amazon anhand eines Gesprächs unter Freundinnen gezeigt, wie das Feature funktionieren kann.

Bitte akzeptiere alle Cookies um dieses Video sehen zu können.

In dem Demo-Video nimmt Alexa nach dem Kommando „Alexa, join our conversation“ an einem Gespräch mit zwei Frauen teil, die darüber diskutieren, welche Pizza sie bestellen wollen – und die sich dabei nur ab und zu an die Sprachassistentin wenden, ohne jedoch nochmals das Aktivierungswort zu benutzen. Dennoch erkennt Alexa, wann sie angesprochen wird und wann nicht.

Obwohl es bis jetzt wenig konkrete Use Cases für die neue Funktion gibt, wird der Umgang mit Smart Speakern durch das Feature grundlegend revolutioniert. Anstatt sich nur mit konkreten Befehlen an die digitale Assistentin zu wenden, wird Alexa zu einem Teil des Gesprächs.

Für diejenigen, die Bedenken hinsichtlich der Privatsphäre haben: Amazon betont, dass lediglich Anfragen, die an Alexa gerichtet sind, an die Cloud gesendet werden.

Wie funktioniert der Konversationsmodus?

Bei der menschlichen Kommunikation ist die körperliche Ausrichtung ein wichtiger Anhaltspunkt, um zu erkennen, an wen das Gespräch gerichtet ist. Dieser Methode macht sich Alexa zu nutzen: Laut Amazon Science dienen im Konversationsmodus sowohl visuelle als auch auditive Signale zur Erkennung, wann das Gespräch an das Gerät gerichtet ist und ob eine Antwort erwartet wird.

Sobald der Modus aktiviert wird, wird mithilfe zweier Modelle (der „CVDD“ und dem „DVAD“-Modell), die Kameraaufnahme und das Audiosignal verarbeitet. Damit wird ermöglicht, dass Alexa sich zum richtigen Zeitpunkt im Gespräch zu Wort meldet und nur antwortet, wenn sie wirklich gefragt ist. Laut eigener Aussage erhöht sich damit die Zuverlässigkeit, dass Alexa sich zu den richtigen Zeitpunkten in der Konversation einschaltet signifikant.

Ausblick

Das Ziel des Konversationsmodus ist es, komplexere und mehrstufige Konversationen, wie Flugbuchungen oder Essensbestellungen, über Alexa zu ermöglichen. Außerdem können Nutzer*innen beiläufiger Fragen stellen und müssen nicht jedes Mal das Aktivierungswort wiederholen.

Die neue Funktion hat allerdings noch einige Einschränkungen: Nutzer*innen müssen sich im Blickfeld der Kamera befinden und auf den Bildschirm schauen. Das stellt sicher, dass Alexa erkennt, welche Sätze an sie gerichtet sind und nicht auf alles reagiert, was im Raum passiert.

Bis jetzt wir die neue Funktion lediglich für Echo Show 10 Geräte der dritten Generation ausgerolltFür welche Geräte der Konversationsmodus in Zukunft verfügbar sein wird und wann die Funktion auf den deutschen Markt kommt, wurde noch nicht bekannt gegeben. 

Ihr benötigt Alexa-Beratung? Sprecht uns gern an! Wir finden eine Lösung.

Jannika Kraus

Jannika unterstützt Future of Voice als Werkstudentin im Bereich Content Marketing.