Sprich mit mir, Alexa!

Sprachassistenten analysiert: Setzt sich die Sprache als User Interface durch?
Keine Kommentare

Apple hat Siri, Windows hat Cortana, Amazon Alexa und Google den Google Assistant. Sprachassistenten erleichtern unseren Alltag. Sprache als Interface gewinnt immer mehr an der Bedeutung bei der Steuerung von Apps und Online-Services. Allein in Europa liegt der Marktumsatz von Smart Speakern bereits bei 939 Millionen Euro, wie Zahlen von Statista bestätigen. In allen Bereichen unseres alltäglichen Lebens sehen wir, wie uns die digitalen Assistenten Schritt für Schritt bei alltäglichen Situationen unterstützen.

Smart Speacker ziehen in die Haushalte ein

„Alexa, schalte das Licht im Wohnzimmer aus!“ – immer mehr Haushalte in Deutschland schaffen sich einen sogenannten Smart Speaker an und vernetzen diesen mit ihren unterschiedlichen Smart-Home-Geräten. Doch übernimmt der dahinter verknüpfte Assistent nicht nur die Steuerung für unterschiedlichen Hausbestandteile, er dient auch zum Auslesen unseres Kontostandes, bestellen von Lebensmitteln oder auch zum Einholen von Informationen.

Als Pionier am Markt hat sich hier Amazon mit seiner Amazon-Echo-Reihe durchgesetzt und als erster einen Markt geschaffen, der so vorher noch gar nicht existierte. Mittlerweile haben alle namhaften Unterhaltungselektronik-Marken einen Smart Speaker im Angebot, der dann mit unterschiedlichen Text-to-Speech-Services und unterschiedlichen APIs verbunden ist.

ML Summit Munich 2020

Market Segmentation in the Era of Big Data

mit Özge Sahin (SkyScry)

Deep Learning mit TensorFlow

Mit Jakob Karalus (Deloitte Consulting)

Allein in Deutschland gab es im Jahr 2019 bereits 11,7 Millionen Smart-Speaker-Konsumenten, die über die Ökosysteme von Google, Amazon oder auch Microsoft erschlossen werden können. Dieser Markt bietet vollkommen neue Möglichkeiten, seine Produkte der Gesellschaft anzubieten oder auch die Omnichannel Experience eines Kunden auf eine neue Ebene zu heben.

Was macht Smart Speaker so „smart“?

An sich haben die Geräte meist gar nicht so viele „smarte“ Eigenschaften. Grundsätzlich sind es erst einmal nur Lautsprecher mit einem Mikrofon und eventuell einer Ansteuerung über Bluetooth oder auch W-Lan. Das eigentliche „smarte“ spielt sich im Hintergrund, in der Cloud ab. Hier residiert die künstliche Intelligenz. Damit der Aufrufer eines Assistenten auch die richtige Antwort bekommt, müssen gewisse Schritte durchgespielt werden, die sich im Prinzip nicht unterschieden. Am Beispiel eines Alexa Skills sieht das wie folgt aus:

  1. Der Kunde stellt eine Frage, bzw. gibt einen Befehl, etwa: „Alexa, ask Digital Bank for my balances“
  2. Alexa streamt die Spracheingabe an den Alexa Voice Service in der AWS Cloud
  3. Dort angekommen wird der Name des Skills identifiziert (Digital Bank) und versucht, die Anfrage zu erkennen und schlussendlich die Daten so zu strukturieren, dass der Alexa Skill aufgerufen werden kann
  4. Dann wird der passende Alexa Skill (AWS Lambda) aufgerufen, der dann eine passende Response erzeugt und diese streamt die entsprechende Antwort an den Alexa Voice Service zurück
  5. Hier wird aus dem formulierten Text Sprache generiert, an das Endgerät vom Kunden gestreamt und dort akustisch ausgegeben

Zielgruppe der Smart Speaker und Sprachassistenten

Mit den sogenannten Millennials und der Generation Z werden zeitnah zwei Generationen das globale Wirtschaftstreiben dominieren, die in einer vernetzten digitalen Welt aufgewachsen sind und die Vorteile einer solchen Welt bereits in jungen Jahren kennengelernt haben. Nachdem Gen Z eine der Generationen ist, mit der zukünftig größten Kaufkraft, wird der Markt der Smart Speaker und Sprachassistenten immer interessanter. Doch häufig ist erkennbar, dass z.B. Akquise-Use-Cases außerhalb von Amazon noch keine vergleichbare Akzeptanz im Markt finden. Man muss den Kunden Zeit geben, um sich an dieses neue Zeitalter zu gewöhnen. So wäre es etwa möglich, mit Hilfe von einem Sprachassistenten eine Omnichannel-Integration aufzubauen. So könnte der Kunde zunächst via Sprachassistent ein Produkt in den Warenkorb legen und sich dann weitere Details und Informationen über die App ansehen, bevor er einen Kauf abschließt. Diese Use Cases muss man spezifisch pro Branche aber auch im Hinblick auf Prozesse betrachten und mit dem passenden Fingerspitzengefühl lösen.

Sprachassistenten in aktuelle IT-Landschaften integrieren

Die ganzen Speech-to-Text- oder Text-to-Speech-Services schaffen schon eine gute Basis, aber wie kommt man eigentlich an die passenden Daten? Meist ist es so, dass man nicht seinen kompletten Datenbestand in die Cloud replizieren möchte, also muss hierfür eine andere Lösung geschaffen werden. Eine sehr beliebte und häufig genutzte Möglichkeit ist die Etablierung einer API-Management-Komponente, um die APIs, die „on premises“ verwendet werden, für die entsprechenden neuen Services zur Verfügung zu stellen. Wie so etwas aussehen könnte, sieht man in folgendem Diagramm:

Wichtig hierbei ist, dass es keine Rolle spielt, ob sich hinter der API-Management-Pattform ein Backend-System, eine selbstgehostete KI-Komponente oder eine KI-Komponente von einem anderen Cloud-Provider befindet. Solange ein API veröffentlicht werden kann, kann es auch angebunden und genutzt werden. Das bedeutet im Umkehrschluss, dass man sich für seinen Use Case bei der Umsetzung nicht auf einen bestimmten Provider festlegen muss.

Fazit

Ob Sprachassistenten oder auch smarte Speaker die Zukunft der Kundenkommunikation sind, ist schwer zu sagen und ich bezweifle es ehrlich gesagt. Denn selbst der beste Smart Speaker wird an der ein oder anderen Stelle ein persönliches Gespräch nicht ersetzten können. Jedoch kann er uns unterstützen, alltägliche Aufgaben zu erledigen. Die technische Implementierung und Integration ist heute bereits sehr weit und so sind hier kaum mehr Grenzen gesetzt. Es bleibt also spannend im Umfeld der Voice Assistants!

Unsere Redaktion empfiehlt:

Relevante Beiträge

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu:
X
- Gib Deinen Standort ein -
- or -