Skip to main content
ben

Lass Dir den Artikel von Bens synthetisierter Stimme vorlesen. Wie das funktioniert erfährst du hier.

Daniel Mittendorf arbeitet als Principal Conversational AI bei Beyto, einer Berliner Voice-Agentur, die seit einigen Monaten (wie schon Future of Voice) zur MUUUH! Group in Osnabrück gehört. Angefangen hat seine Voice Faszination 2017, als er das erste Alexa Gerät aus England importiert hat. Inzwischen wurde er als Alexa Champion ausgezeichnet und hat einige der erfolgreichsten Alexa Skills entwickelt. Wie es dazu gekommen ist, was er über die Zukunft von Voice denkt und wie seine Kinder mit der Technologie umgehen, verrät Daniel im Interview.

Hey Daniel, du bist erst ein paar Jahre im Voice-Geschäft tätig. Was hast du vorher gemacht?

Ich habe zunächst ein Studium im Bereich Druck- und Medientechnologien an der Universität in Wuppertal absolviert und habe hinterher im E-Commerce Bereich gearbeitet.

Wie bist du mit dem Studium im Voice-Bereich gelandet?

Daniel

Im Jahr 2017 habe ich zum ersten Mal etwas von der ganzen Voice-Thematik mitbekommen. Ich fand die Idee – Geräte mit der Stimme zu steuern – so smart und interessant, dass ich einfach mal ausprobieren wollte, was damit schon möglich ist und habe den Echo Dot sowie einen Echo Show 7 aus England importiert.

Als großer Fußballfan hat es mich geärgert, dass ich die Spiele nicht auf den Geräten verfolgen konnte, obwohl die Streams ja online verfügbar waren. Also habe ich aus Eigeninteresse innerhalb von wenigen Tagen den Skill „Stream Player“ entwickelt, mit dem es möglich ist, Alexa Geräte mit Display als Fernseher zu benutzen oder mit Echo-Geräten ohne Bildschirm in das TV-Programm reinzuhören.

Gibt es den Skill noch?

Allerdings! Nachdem einige Freunde und meine Familie die Anwendung getestet haben, habe ich den Skill veröffentlicht. Kurze Zeit später hat sich Amazon bei mir gemeldet und gefragt, ob ich Interesse daran habe, den Skill weiterzuentwickeln und in andere Länder zu bringen.

Mittlerweile ist der Stream Player in neun verschiedenen Ländern und sechs verschiedenen Sprachen verfügbar und unterstützt zahlreiche Sender wie ARD, ZDF, KiKa, aber auch Phoenix oder Nickelodeon.

Vor zwei Jahren wurde ich dann von Amazon zum Alexa Champion ernannt. Das ist eine Auszeichnung, mit der engagierte Entwickelnde und Mitwirkende in der Community ausgezeichnet werden. Ich denke, dass der Stream Player Skill einiges dazu beigetragen hat.

Alexa Champion, wow! Hast du noch weitere Skills entwickelt?

Ja, nach dem Projekt hat mich Amazon immer wieder für weitere Projekte angefragt. Dadurch hatte ich immer weniger Zeit für meinen damaligen Job und habe mich 2019 letztlich selbstständig gemacht. Ein paar Monate später habe ich Mike Metzen und Claudius Herz, die Gründer von Beyto, kennengelernt und bin daraufhin als CTO bei der Voice-Agentur eingestiegen. Gemeinsam haben wir zahlreiche Voice-Anwendungen, unter anderem für die Sportschau, Kinoheld, ORF und Bosch entwickelt.

Nutzt du die Anwendungen auch privat?

Gerade die Entwicklung des Sportschau Skills hat mir als großer Fußballfan besonders Spaß gemacht! Ich kann alle Live-Sportarten, welche die Sportschau ausstrahlt, live oder auf Abruf verfolgen. Dazu gehören auch alle Fußball-Inhalte der Bundesliga, 2. Bundesliga, dem DFB-Pokal und allen Spielen mit deutscher Beteiligung in der Champions League. Gerade im Auto oder wenn ich die Hände gerade nicht freihabe, ist das besonders praktisch. Generell war der Austausch mit dem Sportschau-Team und dem WDR sehr inspirierend.

Mittlerweile haben wir bei uns zu Hause in fast jedem Raum ein Alexa-Gerät stehen und lassen viele Dinge über Smart Home Funktionen steuern. Beispielsweise geht das Licht in bestimmten Bereichen an, sobald es dunkel wird oder die Klappe von unserem Hühnerstall schließt sich automatisch, sobald ich Alexa sage, dass die Hühner drinnen sind.

Wie gehen deine Kinder mit der Technologie um?

Es ist wirklich faszinierend zu sehen, wie intuitiv meine Kinder mit der Voice-Steuerung umgehen und einfach ausprobieren, ohne vorher eine Anleitung gelesen zu haben.

Ist es dabei schon zu Situationen gekommen, die dir im Gedächtnis geblieben sind?

Da fallen mir tatsächlich zu beiden Kindern Geschichten ein:

1

Als meine Tochter vier Jahre alt war, hat sie ihre Spielzeuguhr mit Alexa angesprochen und gefragt, wie spät es ist.
2

Mein Sohn hatte über Wochen alle Mathehausaufgaben richtig – bis wir in den Alexa-Verlauf geschaut und gesehen haben, dass nicht er selbst die Aufgaben gelöst hat.
Tweet Daniel Tochter spricht mit uhr

Und wie reagierst du in solchen Situationen?

Wie bei jedem Thema in der Kindererziehung, muss jedes Elternteil selbst entscheiden, wie er oder sie damit umgehen möchte. Meiner Meinung nach kann man Kinder nicht mehr komplett ohne Smartphone, Laptops und eben auch nicht ohne Voice-Technologie erziehen.

Wir haben unseren Kindern klare Regeln mit der Benutzung gesetzt – was sie wie lange dürfen und wann wir die Nutzung einschränken. Mittlerweile können Eltern über die Kids+ Funktion einzelne Skills aktivieren, die Shopping-Funktion ausschalten und einsehen, welche Skills wie lange genutzt wurden. Somit haben Eltern die volle Kontrolle und entscheiden, welche Inhalte und Features ihre Kinder sehen.

Und wie stehst du zum Thema Datenschutz? Eine gewisse Skepsis bei der Technologie lässt sich ja nicht leugnen...

Es ist Fakt, dass die Aufzeichnungen von Smart Speakern zur Datenverarbeitung an die Cloud gesendet werden, das lässt sich nicht vermeiden. Allerdings werden Gespräche erst aufgezeichnet, wenn das Aktivierungswort („Alexa“, „Hey Google“, “Hey Bixby” oder „Hey Siri“) wahrgenommen wird. Ohne dieses Wort geht sozusagen alles, was gesagt wird, zum einen Ohr rein und zum anderen wieder raus.

Allerdings erhalten die Entwickelnden der Skills nie die Audioaufnahmen selbst, sondern nur eventuell notwendige Wörter (wie den Namen eines Podcasts oder Produkte auf einer Einkaufsliste), häufig nur den Intent (Aufgabe oder Aktion), also beispielsweise, dass der/die Nutzer:in die Funktion X ausgeführt hat oder ausführen möchte oder in seltenen Fällen das Transkript. (Mehr zum Thema Datenschutz bei Voice-Anwendungen findest du in diesem Artikel.)

Gibt es Einstellungen, die man diesbezüglich treffen kann?

Ja, wer im Hinblick auf Datenschutz skeptisch ist, kann selbst Vorkehrungen treffen und sich somit schützen. Wie bei Apps für das Smartphone ist es wichtig, nicht jeden Skill blind zu installieren und der Datenschutzerklärung zuzustimmen. Um das Risiko zu minimieren, reicht es schon den Skill vor Aktivierung einmal kritisch zu untersuchen. Mittlerweile bietet Alexa – und auch andere Smart Speaker – einige Befehle, um den Datenschutz selbst in die Hand zu nehmen. Somit kann man zum Beispiel alle Aufnahmen automatisiert nach ein paar Tagen löschen lassen.

Was denkst du, wie sich die Voice-Technologie in den nächsten Jahren weiterentwickelt?

Amazon hat mit Alexa unglaubliche Vorarbeit geleistet, um die Voice-Technologie nach Deutschland zu bringen und sie für alle Menschen zugänglich zu machen. Ich denke, dass die Plattform in den nächsten Jahren noch wachsen wird, aber auch neue Kanäle entstehen und wir Voice mehr in unserem Alltag benutzen, als nur mit Smart Speakern zu sprechen.

Ich bin gespannt auf alle zukünftigen Projekte, die ich gemeinsam mit Future of Voice und der MUUUH! Group umsetzen werde.

Jannika Kraus

Jannika unterstützt Future of Voice als Werkstudentin im Bereich Content Marketing.