Voice User Interfaces VUI in der Kommunikation

Voice User Interfaces (VUI) sind eine Entwicklung, mit der Unternehmen sich heute dringend beschäftigen sollten.
„Alexa, frage die Deutsche Bahn nach einer Verbindung von Hamburg nach Frankfurt!“
Können Sie sich vorstellen, so einen Zug zu buchen? Oder wäre es Ihnen persönlich lieber, Siri oder den Google Assistent zu fragen, die Webseite zu besuchen und die Verbindung dort selbst zu buchen, die Buchung über einen ChatBot in WhatsApp oder Facebook Messenger zu tätigen, eine App aufzurufen, oder bei der Bahn mit einem Mitarbeiter zu sprechen? 
Egal, wie Ihre persönlichen Vorlieben sind, die Entscheidung für die auf die Kundensituation optimierte User Experience und die anschließende Umsetzung stellen jedes Unternehmen vor gewaltige Herausforderungen. 

Kundenerwartung an ein Voice User Interface VUI

Ihre Kunden erwarten, den für sie einfachsten und bevorzugten Kommunikationskanal angeboten zu bekommen. Und echte Marktführer zeichnen sich dadurch aus, die Vorteile der einzelnen Kanäle als Erste zu nutzen und dem Kunden so echte Alternativen zum Wettbewerb zu bieten. Der Kunde entscheidet innerhalb von 30 Sekunden beim ersten Versuch, ob er diesen Kanal ein zweites Mal verwenden wird. Das bietet sehr wenig Raum für Experimente.

Unterschiede zu tradierten User Interfaces

Zwischen den einzelnen Kommunikationsformen gibt es eklatante Unterschiede in den Charakteristika. Die Spracheingabe muss völlig anders aufgebaut werden als die Eingabe über eine Webseite oder innerhalb eines Messengers, da die visuelle Information völlig wegfällt. Die Entwicklung eines Voice User Interface stellt völlig neue Anforderungen – es ist wesentlich serieller und auch wesentlich langsamer als ein Grafisches User Interface (GUI). Das Ohr kann jeweils nur eine Information gleichzeitig verarbeiten, während das Auge aus unterschiedlichen Symbolen in Sekundenbruchteilen Muster erkennt und dadurch multiple Informationen gleichzeitig verarbeitet. Der gesamte sprachlich geführte Eingabeprozess ist langsamer, Pausen müssen eingerechnet, Eingaben immer wieder bestätigt und verifiziert werden. So wird auf beiden Seiten ein hoher Grad an Klarheit und Verständnis erreicht. Hinzu wird ein gewisser Grad an Feinfühligkeit angestrebt, der dem Kunden das Gefühl einer persönlichen Betreuung gibt. 
Der Kunde hat sehr spezielle, seiner Situation entsprechende Erwartungen und bildet sich schnell eine Meinung über die Qualität des Dialogs, der im Vergleich eher langsam ist.  Die Dialogführung muss also sehr schnell zum Punkt kommen und ausgewählte, passende Ergebnisse liefern. In unserem Beispiel der Zugbuchung reduziert sich die mögliche Auswahl auf zwei oder drei sinnvolle Verbindungen, mehr sind nur schwer darstellbar – die Anforderung an die Relevanz der Ergebnisse ist also ungleich höher als beim Buchungsvorgang auf der Webseite. Insofern sollte der vorangegangene Dialog zusätzliche Informationen vorab abgefragt haben, Kundenpräferenzen kennen oder über zusätzliche Eingrenzungsalgorithmen verfügen.
Je komplexer der Geschäftsprozess, desto komplizierter wird die Entwicklung dieses Dialogs. Das Unternehmen muss also erst einmal ein Dialogmodell erarbeiten, das völlig unabhängig von der bisherigen Modellen und auf Spracheingabe optimiert ist.

Daten sind wichtigstes Qualitätsmerkmal

Allen Formen der Kommunikation ist die Qualität der zugrundeliegenden Daten als Qualitätsmerkmal gemeinsam. Früher hat sich der Kunde über den CallCenter-Mitarbeiter aufgeregt, der keinen Zugriff auf die Details hatte. Heute erwartet er, dass der Bot nicht nur die Basisdaten kennt, sondern auch seine eigenen Vorlieben oder auch zusätzliche Daten wie seinen Standort oder aktuelle Ereignisse. Der Kunde geht davon aus, dass der Bot erkennt, wo der Kunde ist, die aktuelle Verkehrssituation kennt und auch in Betracht zieht, dass schlechtes Wetter zu Zugverspätungen geführt haben könnte und deswegen einen völlig anderen Reisevorschlag macht.
Dies alles erfordert eine durchgängige Planung auf der Marken- wie auf der Technologieebene notwendig, um die die Grundlage für die Ausführung auf der Produktebene zu legen. Dabei müssen – neben den genannten Bedingungen – insbesondere die Einsatzszenarien betrachtet werden. In welcher Situation entscheidet sich welcher Kunde für welchen Kommunikationskanal, und was erwartet er in diesem speziellen Fall? Wann ist ein Voice-first-Ansatz sinnvoll, der dem Kunden eine Alternative zur Webseite oder zu einem ChatBot in einem Messenger bietet? Wie groß ist meine Zielgruppe für VUI, und welche Präferenzen hat sie? Welche Mechanismen kann ich einsetzen, um den Kunden eindeutig zu identifizieren, damit ich die immer wiederkehrende Eingabe von Kundendaten vermeide und trotzdem die notwendige Datensicherheit gewährleisten kann? Und letztlich muss auch die Frage geklärt werden, wie hoch die Aufwände in der Entwicklung und Umsetzung gegenüber der zu erwartetenden Rendite sind und wann sich die Entwicklung tragen wird.

Zuerst die Markenstrategie für Voice und VUI entwickeln

Marketingmanager und CMOs werden derzeit von unterschiedlichsten Anbietern mit Informationen und Vorschlägen bombardiert, wie sie diese neuen Kommunikationskanäle einfach und schnell  in ersten Testprojekten umsetzen können. Wir empfehlen, sich zuerst mit einer gesamtheitlichen Planung auseinanderzusetzen und die Ebene der Werkzeuge und Plattformen unterzuordnen. Stattdessen werden die heute realistisch einsetzbaren Technologien im Bereich AI, Sprache und Integration ermittelt und eine realistische Abschätzung der Entwicklung in den nächsten Jahren erstellt. Die technischen Anforderungen und die Roadmap definieren die Anbieter, die in der Umsetzungsebene zum Tragen kommen. In diesem Umfeld ist die Auswahl einer oder mehrerer Plattformen eine langfristige Entscheidung, die nicht ohne weiteres wieder gekippt werden kann. Aktuelle Use Cases, die zukünftige Roadmap sowie der explizite Nachweis von Kompetenzen sind wichtig, um die optimale Plattform und den richtigen Serviceanbieter zu identifizieren.
Am Ende gilt nur eines: der Kunde verzeiht Ihnen keine Fehler mehr – Sie haben wenig Möglichkeit, zu experimentieren. Sie haben 30 Sekunden, um ihn von Ihrer Kommunikation zu überzeugen.
Dieser Artikel wurde auch hier bei ISG Research veröffentlicht.