Skip to main content

Benjamin ist seit 2019 als Technical Consultant bei Future of Voice am Start. Was hinter der Berufsbezeichnung steckt und warum ihn das Thema Voice so fasziniert, erfährst du im Interview. 

Hey Benjamin, du hast das größte deutsche Alexa-Forum gegründet. Wie ist es dazu gekommen?

2016 waren die ersten Alexa-Geräte in der UK verfügbar und ich war sofort von dem Thema begeistert. Es war der erste Kanal, der der breiten Masse Zugang zum Thema Voice ermöglicht hat. Damals musste man die Geräte noch aufwendig importieren und es sind immer wieder die gleichen Fragen aufgetreten, weil einfach Informationen gefehlt haben. Ich wollte eine Möglichkeit bieten, um sich über das Thema auszutauschen und Fragen zu stellen. Eine Facebookgruppe wäre nicht wirklich effizient gewesen, also habe ich Alefo gegründet. 

Mittlerweile gibt es deutlich mehr Informationen und detaillierte Anleitungen zu den Smart Speakern, weshalb das Forum nicht mehr so aktiv genutzt wird, wie zu Anfangszeiten. Gerade im Bereich Smart Home gibt es aber noch einige aktive Nutzer:innen. 

Dafür braucht man bestimmt einige technische Kenntnisse, oder? Hattest du die schon vorher?

Nach meinem Realschulabschluss habe ich mit 16 eine Ausbildung als Fachinformatiker für Anwendungsentwicklung an der Freien Universität Berlin absolviert. Danach habe ich dort noch bis Ende 2018 als Entwickler gearbeitet und nebenbei Alefo gegründet. 

In dieser Zeit habe ich das „Handwerk“ der Programmierung erlernt. Als Entwickler beschäftigte ich mich allerdings auch mit dem Betrieb der dahinter liegenden Infrastruktur.  Als Entwickler hatte ich auch größere Projekte im Alleingang managen und realisieren müssen. Auch wenn meine Arbeit mittlerweile deutlich anders ausschaut, hilft mir dieses Wissen ab und an noch weiter, wenn es um die Realisierung von Kundenprojekten geht. 

Kann man sagen, dass deine Leidenschaft für Voice nach wie vor ungebrochen ist?

Definitiv! Ich bin ein Fan von Voice-Anwendungen, die in den Alltag integriert werden und wirklich einen Mehrwert bieten. Zum Beispiel würde ich mir wünschen, dass die deutschen Speditionsunternehmen es einfach als Normalität ansehen einen entsprechenden Voice Skill zu haben, der gut funktioniert und Kund:innen informiert, wo ihr Paket gerade ist und wann, wie, wo es ankommt – solche Anwendungen müsste es viel häufiger geben. 

Aber nicht nur das Thema Voice, sondern das gesamte Conversational AI Thema begeistert mich. Ich hoffe, dass die Hemmung mit einem automatisierten System zu kommunizieren, weiterhin abnimmt.  

Was ist Conversational AI? 

Sammelbegriff für Kommunikation zwischen Nutzer:innen und Computern mittels automatisierter Dialogsysteme und Künstlicher Intelligenz.

Future of Voice ist eine der führenden Agenturen im Conversational-Bereich. Wie bist du dort gelandet und was ist deine Aufgabe?

Benjamin Vetter

Alexa-Forum-Gründer Benjamin Vetter

Malte Kosub, einer der Gründer von Future of Voice ist auf mich aufmerksam geworden und hat mich gefragt, wie ich mir meine berufliche Zukunft vorstelle. Ich hatte Lust auf etwas Abwechslung und so hat sich das Ergeben. Gestartet bin ich bei FoV als Entwickler, bin aber immer mehr in die Beratungsrolle hineingewachsen und mittlerweile ist es mein Alltag, auch die Rolle des Projektleiters zu übernehmen – meine aktuelle Berufsbezeichnung ist Technical Consultant.  

Generell berate ich Unternehmen zu Voice und Conversational Themen. Häufig geht es erstmal darum das Unternehmen für diese Technologien zu begeistern und ihnen zu zeigen, dass es sich nicht nur um einen PR-Gag handelt, sondern wirklich Mehrwert entsteht. Gemeinsam mit dem Unternehmen erarbeite ich sinnvolle Use Cases, um neue Potenziale auszuschöpfen und kläre über das weitere Vorgehen und die technische Umsetzung auf. Mit bestehenden Kund:innen habe ich regelmäßige Abstimmungen, in denen wir den aktuellen Status und den weiteren Verlauf des Projektes besprechen. Dazu kommt dann die Umsetzung. 

Du bist trotz deiner Position als Technical Consultant also nach wie vor im operativen Tagesgeschäft tätig?

Ja, genau. Wenn die Themen evaluiert sind, dann unterstütze ich weiterhin bei der Umsetzung. Dabei arbeite ich oft mit Kolleg:innen aus dem Conversational UI Design zusammen, um die sprachlichen Spezifika zu beachten. Ich implementiere Anwendungen, überwache sie und bin regelmäßig mit anderen Entwickler:innen in Abstimmung, um letzte Feinheiten umzusetzen.  

Besonders charmant finde ich die Abwechslung zwischen Beratung und Umsetzung. Ich mag es, diese Themen für Unternehmen greifbarer zu machen und Endkund:innen einen Mehrwert über Kanäle zu bieten, die sie schon längst benutzen.  

Dabei gefällt mir besonders gut, dass Future of Voice aus dem Startup-Status rausgewachsen ist, das Mindset aber noch beibehält. Wir sind familiär, arbeiten agil und passen uns den aktuellen Bedingungen an, evaluieren regelmäßig neue Technologien und gehen mit der Zeit. Ich glaube, dass wir anderen einen Schritt voraus sind, weil wir nicht dieses starre Mindset haben. 

Gibt es trotz all der positiven Seiten auch Challenges? Wenn ja, wie begegnest du ihnen?

Ja, die gibt es. Vor allem größere Kund:innen und Konzerne haben meist ein sehr diverses und umfangreiches technisches Umfeld. Außerdem bestehen oft sehr spezifische und hohe Anforderungen, was IT-Sicherheit und Datenschutz angeht. Gerade Sprachassistenten und sprachliche Synthese sind Themen, bei denen einige erstmal sehr skeptisch sind und sich nicht vorstellen können, dass es datenschutzkonform funktioniert. Wir setzen uns gemeinsam mit den Kund:innen zusammen, evaluieren alle Anforderungen und schauen dann gemeinsam, wie sich das Thema umsetzen lässt. 

Außerdem müssen wir es schaffen die Endkund:innen abzuholen, damit sie wissen, was mit ihren Daten passiert und sie sich bei der Benutzung sicher fühlen, ohne sie mit zu vielen Informationen zu überschütten. Das ist ein Spagat, den wir täglich machen – aber eigentlich schaffen wir es immer eine gute Lösung zu finden.  

Wenn du von deiner Arbeit erzählst, merkt man, dass du für deinen Job bei Future of Voice wirklich brennst. Oder täuscht der Eindruck?

Nein, gar nicht. Die Voice Technologie steckt noch in den Kinderschuhen und ich bin gespannt, ob das ganze Erwachsen wird. Was noch fehlt sind Anwendungen, bei denen nicht mehr nur das spielerische im Vordergrund steht, sondern die Endkund:innen sie gerne nutzen, weil sie ihnen einen Mehrwert bringen. Da hat sich bereits einiges getan, aber ich hoffe, dass sich in den nächsten Jahren noch einiges tun wird und ich etwas dazu beitragen kann.   

Außerdem bin ich gespannt, wie Google sich zukünftig auf Smart Speakern präsentieren wird, weil das Unternehmen seine Conversational Actions einstellen wird. Amazon hat sich dahingehend noch nicht positioniert. Für Alexa hoffe ich, dass angekündigte Funktionen und Funktionalitäten, die bereits in den USA verfügbar sind, auch nach Europa und Deutschland kommen. So wurde beispielsweise bereits 2021 ein name-free interaction (NFI) Toolkit angekündigt, welches den Aufruf von Skills ohne Invocation Name ermöglicht. Eine tolle Möglichkeit, welche allerdings noch immer nur als Preview verfügbar ist und das auch nur für die englische Sprache. Manchmal ist es etwas ernüchternd zu sehen, was schon alles möglich ist, aber wie lange es dauert, bis diese Funktionen auch hier verfügbar sind. Auch deswegen erhoffe ich mir, dass der Markt rasant wächst und die Nachfrage steigt. Wir haben eine Menge Ideen und freuen uns darauf, sie mit unseren Kund:innen umzusetzen. 

Du benötigst Alexa-Beratung? Sprich Benjamin gern an! Wir finden eine Lösung.

Jannika Kraus

Jannika unterstützt Future of Voice als Werkstudentin im Bereich Content Marketing.