Skip to main content

Eigentlich sollte „Voice“, also die Sprachsteuerung, schon seit langem alles verändern. „Alle warten auf den Big Bang und möchten in einer technologischen Wunderwelt aufwachen, in der alles per Sprache gesteuert wird, bevor sie in die Technologie investieren“, teilt Ben Ellermann, CEO von Future of Voice, seine Erfahrungen.

Das Smart Speaker und Sprachassistent*innen schon längst in der breiten Masse angekommen sind und wieso Unternehmen eine Custom Neural Voice brauchen, verrät Ben in seinem Vortrag „mit Voice zu neuen Horizonten“ auf dem Deutschen Marken- und Designkongress.

„Voice“ - was ist das eigentlich?

Um die Erwartungshaltung der Zuhörer*innen auf einen Nenner zu bringen, beginnt Ben mit einer Eingrenzung des „Voice“ Begriffes. Sein Vortrag basiert auf den drei Säulen „Smart Speaker“, „Synthetische Stimme“ und „Phone“ – einem alten Kanal mit sehr viel neuem technologischen Potenzial.

Die unglaubliche Flexibilität, die Voice mit Hilfe von automatisierten Dialogen (Conversational AI) bietet, veranschaulicht Ben anhand einer Lego Platte: „Ein Dialog ist ein extrem einfacher, super vielfältiger Standard, auf dem Sie so ziemlich alles aufbauen können, was Sie “. Die Ziele sind die Reduktion der Servicekosten, die Verbesserung des Kundenerlebnisses sowie eine Erhöhung der inkrementellen Verkäufe.

Smart Speaker: Einfacher, schneller, natürlicher

Die meisten Unternehmen beschäftigen sich noch nicht mit dem Kanal „Voice“, da dieser noch nicht in der breiten Masse angekommen sei – die Zahlen sagen etwas anderes: Tatsächlich besitzen fast 26 % der deutschen Erwachsenen einen Smart Speaker und bis zu 45 % nutzen Sprachassistent*innen.

Ein Großteil der Nutzer*innen steuert mit der Technologie Geräte im Haus, spielt Musik ab oder benutzt das Radio. Eine weitere Studie zeigt sogar, dass 45 % der Smart Speaker Nutzer*innen ihre gewohnte Radionutzung durch die Nutzung von Smart Speakern substituiert haben. Diesen Fakt haben wir uns zu nutzen gemacht.

Alexa, ich möchte Yoga machen!

Normalerweise strahlt eine Marke einen Werbeclip über das Radio aus und erreicht dadurch Kund*innen. „Unternehmen vergeuden viel Energie, um herauszufinden, ob und welche konkreten Ergebnisse die Radiokampagne erzielt hat“, erklärt Ben, „genau da setzen unsere Smart Speaker Radio Kampagnen an.“

Unter anderem durften wir einen Alexa Skill für die VGH Versicherung umsetzen. Starten Smart Speaker Nutzer*innen das Radio wird ein Werbespot abgespielt, der auf den Skill hinweist. Wir schaffen einen fließenden Übergang – aus einem Radiospot wird eine interaktive Werbung. Nutzer*innen können den Skill ohne Medienbruch direkt starten. Weitere Alexa Skills haben wir unter anderem für das DRK und Vodafone umgesetzt.

Die Power von Bots in der Telefonie

Im zweiten Teil des Vortrags geht es um Voice-Technologien und „das gute alte Telefon“. Fast 50 % der Deutschen wählen nach wie vor den Telefonkanal zur Kontaktaufnahme mit Unternehmen. In allen Branchen ist das Telefon der meistbenutzte Kommunikationskanal.

Dabei ist die Erwartungshaltung und die Macht der Kund*innen so hoch wie nie zuvor. Demgegenüber stehen Contact Center, die den hohen Anforderungen der Kund*innen gerecht werden müssen. Dies gelingt mit der Dialog Automation im E-Commerce.

Bei dem automatisierten Kundenservice handelt es sich um Prozesse, die darauf ausgelegt sind, die Notwendigkeit menschlicher Beteiligung bei Kundenanfragen zu reduzieren oder sogar zu eliminieren. Zu Aufgaben, die Bots problemlos übernehmen können, gehören unter anderem die Authentifizierung, Adressänderung, Terminvereinbarung, Bestell-/Lieferstatus sowie Retourenservice, Rechnungsanforderung, Anliegenerkennung und das Rückrufmanagement.

„Wir haben die Erfahrung gemacht, dass die Automatisierung von standardisierten Use Cases im Kundenservice keine Arbeitsplätze vernichtet. Die meisten Mitarbeitenden sind froh, wenn diese repetitiven Use Cases wegfallen. Das kann sogar die Kreativität fördern.“ erklärt Ben.

Custom Neural Voice - das nächste Level

Der dritte Teil des Vortrags dreht sich um die Custom Neural Voice – aber was ist das eigentlich? Eine Custom Neural Voice ist eine individuelle synthetische Stimme der höchsten Güteklasse. Durch den Einsatz von Deep Neural Networks können wir einen menschlichen Sprecher so nachahmen, dass wir ihn danach nicht mehr benötigen, um Audioinhalte zu produzieren. Stattdessen bringen wir den menschlichen Sprecher mittel Text-to-Speech in Echtzeit zum Sprechen.

Warum brauchen Brands Custom Neural Voice?

Mit der Custom Neural Voice Technologie beginnt für Audiobranding und Voice Marketing das nächste Level. Die hohe Qualität der synthetischen Custom Neural Voice in Kombination mit der Flexibilität, die sich aus der Produktion in Echtzeit ergibt, ermöglichen die Umsetzung ganz neue Use Cases.

Über den Deutschen Marken- und Designkongress

Unter dem Motto „Change – new horizons“, wurde der Deutsche Marken- und Designkongress am 11. November 2021 als Hybridveranstaltung im Porsche Museum, Stuttgart ausgetragen. Interdisziplinäre Expert*innen aus Forschung und Wissenschaft, erfolgreiche Praktiker*innen aus dem Markenmanagement und kreative Agenturen berichteten und diskutierten hier über Branding- und Designkonzepte.

Quelle: Rat für Formgebung / Foto: Lutz Sternstein – www.phocst.com

Voice-Technologie für Dein Unternehmen? Yes, please!

Du möchtest Voice-Technologien jetzt schon für Dein Unternehmen nutzen? Nimm jetzt Kontakt zu uns auf und wir besprechen gemeinsam, wie „Voice“ Dein Unternehmen weiterbringen kann.

Jannika Kraus

Jannika unterstützt Future of Voice als Werkstudentin im Bereich Content Marketing.