Amazon Alexa, Google Assistant, Microsoft Cortana – Battle of the Bots

Laut den „Top 20 Strategic Predictions for 2017 and Beyond“ von Gartner werden wir in knapp drei Jahren mehr mit Maschinen sprechen als mit Menschen. Konkret sagt Gartner voraus: By 2020, the average person will have more conversations with bots than with their spouse.

Mehr Gespräche mit Bots als mit dem Ehepartner? Auf den ersten Blick ein ebenso beängstigender wie bedrückender Gedanke – na gut, zugegeben nicht für jeden Ehepartner…

Ferngesteuerte Online-Zombies?

Doch wer sich angesichts solcher Vorhersagen eine Welt ohne soziale Interaktionen vorstellt, in der wir Mitmenschen ignorieren und unsere Beziehung zu unseren persönlichen Assistenten einer Beziehung gleicht, hat zwar eine gute Fantasie (oder nur einfach zu oft „Her“ gesehen). Tatsächlich sollte man jedoch davon ausgehen, dass ein Großteil der Konversationen mit smarten Assistenten und KI-gepowerten Bots lediglich dazu dienen wird, die händische Bedienung unserer Smart Devices zu ersetzen und zu vereinfachen. Dazu gesellt sich die Tatsache, dass ein Teil unserer Webbrowsing-Zeit nicht mehr am Bildschirm stattfinden wird. Sagt jedenfalls Gartner. Konkret sollen laut den Vorhersageexperten 30 Prozent der Browsingzeit nicht mehr am Bildschirm stattfinden. Anfragen, Suchen oder Dienste werden sozusagen „mündlich“ in Anspruch genommen. Und überhaupt sollte man solche „Vorhersagen“ immer sehr kritisch hinterfragen, Stichwort „Hype Cycle“ und „heiße Luft“.

Die Big Four im Smart Assistant War

Wie auch immer die genaue Zahlen in vier Jahren aussehen werden: Die großen Technologiekonzerne, sprich die Googles, Amazons, Microsofts und Apples dieser Welt, rüsten sich auf jeden Fall für einen harten Konkurrenzkampf bei den Smart Assistants – eine Battle of the Bots sozusagen. Apple hatte einst mit Siri die Schlacht eröffnet, scheint aber inzwischen im Big-Four-Vergleich ein wenig ins Hintertreffen geraten zu sein. Jedenfalls sind Lösungen wie Amazon Alexa oder Google Assistant der Apple-KI in puncto Funktionsumfang inzwischen klar voraus. Microsoft hingegen sollte man unbedingt auch auf dem Radar haben. Mit Cortana schicken sich die Redmonder an, Amazon und Google ein Stück vom Bot/Assistant-Kuchen streitig zu machen.

Nonvisuelle Interaktion als Paradigmenwechsel

Doch welche Implikationen hat das Aufkommen von Smart Assistants für diejenigen, die sich erschaffen und programmieren? Bisher sieht man über wenig natürlich Umgangsformen und Gesprächswechsel hinweg, weil die Technologie noch in den Kinderschuhen steckt. Doch in Zukunft wird aus meiner Sicht ein sehr spannender Aspekt ganz oben auf der Liste stehen: Während Webentwickler und -designer sich jahrelang darüber Gedanken gemacht haben, wie man uns visuell ansprechend, effizient und nutzerfreundlich durchs Web und durch Software im Allgemeinen führt, gibt es noch wenig Erfahrungen und Best Practices zur optimalen Gestaltung nonvisueller Interaktion. Ganz zu schweigen vom Sicherheitsaspekt. Passwörter laut auszusprechen wäre albern, das ist jedem klar. Doch wie sieht eine sinnvolle Authentifizierungsmethode aus, wenn man ohne Bildschirm online unterwegs ist? Es scheint, als ob in puncto User Experience und Security im Umgang mit smarte Assistenten noch viele Fragen auf eine Antwort warten.

Geschäftsmodelle anpassen

Für die großen Tech-Konzerne dürfte beim Thema Bots und Smart Assistants vor allem eine Frage im Vordergrund stehen: Wie passt man bisherige Geschäftsmodelle an ein etwaig geändertes Nutzerverhalten an? Beispiel Google: Per Sprache auslöste Suchanfragen mit Sprachantworten haben aus Google-Sicht ein gewichtiges Defizit: Ein Geschäftsmodell, das in großen Teilen auf dem Ausspielen passender Ads zu Suchanfragen basiert, ist damit (bis jetzt) nicht kompatibel. Und auch Amazons Geschäftsmodell ist naturgemäß stark an die Interaktion mit einem Bildschirm gebunden. Die naheliegende Lösung, die Google, Amazon und auch Microsoft praktizieren: Third-Party-Anbieter durch die Integration sogenannter Skills ins Boot holen und damit zwei Fliegen mit einer Klappe schlagen. Einerseits erhöht man so den Nutzwert des eigenen Assistenten. Andererseits erhöht man so die Chance, dass einem die Kunden dank hoher Relevanz erhalten bleiben und nicht zur Konkurrenz abwandern.

Bot-Battle: Zweikampf statt Vierkampf

Ich wage keine Prognose, wer von den Big Four am Ende die Nase vorn haben wird und den besten Bot bzw. Assistenten anbietet. Nur so viel: Amazon hat mit Alexa mal so richtig vorgelegt und bietet – inzwischen auch hierzulande – ein interessantes Gesamtpaket, das nicht zuletzt mit der Integration von Angeboten wie Amazon Video und Amazon Music, aber auch mit der Steuerung von Smart-Home- und Unterhaltungselektronik punktet. Was jedoch das reine Potenzial angeht, bin ich gespannt, wie sich Google Assistant entwickelt. Denn dass Google in der Lage ist, sich aus einer unfassbaren großen Datenmenge bedienen, kann sich jeder vorstellen. Und diese Daten spielen eine nicht unwesentliche Rolle, wenn man einen möglichst effektiven Smart Assistant anzubieten. Schon jetzt deuten erste Vergleiche von Google Home (mit dem Google Assistant) und Amazon Echo (mit Amazon Alexa) daraufhin, dass Google beispielsweise in puncto Kontextbezug und Folgefragen die Nase vorn hat.



Amazon Alexa als persönlicher Butler

Für mich persönlich spielt vor allem die Frage der Heimautomatisierung bzw. der Steuerung meiner Unterhaltungselektronik eine Rolle. Deswegen beginnt mein eigenes Smart-Assistant-Abenteuer mit Amazon Alexa. Ok, viel Auswahl hat man ja nicht, denn Google Assistant ist hierzulande noch nicht erhältlich. Sobald mich also Amazon (nach vor Wochen erfolgter Reservierung) endlich das Echo-Device sowie ein, zwei Dots bestellen und kaufen lässt, bin ich sehr gespannt zu sehen, wie sich die virtuelle Dame im Alltag schlägt. Neben den üblichen Smart-Assistant-Features wie Wettervorhersage, Kalender oder To-Do-Listen interessiert mich am meisten, wie ich Echo und Alexa einsetzen kann, um die Bedienung diverse Devices zu vereinfachen. Fernseher, Settop-Box, AV-Receiver, NAS, Mediaplayer, etc. – alles Geräte, die sich im meinem heimischen Netzwerk befinden. Und die möchte idealerweise per Sprachbefehl ansteuern. Das sollte schneller gehen, als die entsprechenden Knöpfe auf mehreren Fernbedienungen zu drücken (von denen mindestens eine von meinem Sohn irgendwo versteckt worden ist). Viel verspreche ich mir von den Alexa Skills, also der Möglichkeit, den Funktionsumfang durch neue Fähigkeiten zu erweitern – sei es durch bereits verfügbare oder durch das Programmieren eigener Skills (wie das funktioniert, erklärt übrigens der Beitrag „Alexa Skill: Die ersten Schritte„). Erste Recherchen deute daraufhin, dass ich aber wohl noch Zusatzgeräte wie ein Harmony Hub von Logitech anschaffen muss, um dann, bspw. per IFFT als „Mittler“, verschiedenste Makros und Sequenzen zu programmieren. Aber hey, sollte dann ein Sprachbefehl wie „Alexa, Heimkino an!“ das gewollte Ergebnis bringen, wird mein Nerd-Herz Luftsprünge machen vor Freude.

Wird die Technik angenommen?

Zurück zum Ausgangspunkt. Ich bin nach wie vor sehr skeptisch, ob sich die Kommunikation mit smarten Assistenten in allen Lebensbereichen durchsetzen wird. Dass man in den eigenen vier Wänden bereitwillig mit einem Bot oder Smart Assistant kommuniziert, ist nachvollziehbar. Insbesondere, wenn es schnell und komfortabel vonstatten geht. Die Sache sieht jedoch meiner Meinung ganz anders aus, wenn man sich im öffentlichen Raum bewegt. Ich, für meinen Teil, komme mir komisch vor, im Bus oder im Restaurant mein iPhone zu zücken, um Siri um Hilfe zu bitten. Aber vielleicht ist dieser Umstand auch nur meinem Alter geschuldet. Die Generation, die mit Smartphones und dem Wissen, überall online sein zu können, aufwächst, hat oft einen ganz anderen Zugang zu – und Umgang mit – neuen Formen der Interaktion.

Datenschutz und Privacy

Und dann wäre da noch der Aspekt Datenschutz, den wir ja als Deutsche immer besonders im Auge haben. Abgesehen davon, dass Alexa natürlich immer mithören muss, um auf eine Ansprache reagieren zu können, ist noch die Frage zu beantworten, was mit dem „Abgehörten“ passiert. Es ist davon auszugehen, dass Sprachanfragen genauso gespeichert und genutzt werden wie die Anfragen, die wir übers Web schriftlich an Amazon und Google stellen. Und zwar nicht nur, um den jeweiligen Dienst für andere Nutzer zu verbessern, sondern auch, um mir entsprechend personalisierte Angebote und Werbung auszuspielen. Etwas Anderes zu glauben wäre naiv.

Der große Unterschied ist aber folgender: Eine Google- oder Amazon-Suchanfrage ist etwas, das ich gezielt ins Suchfeld eintippe. Amazons Alexa muss aber einfach immer mithören, um auf das Signalwort „Alexa“ reagieren zu können. Es ist deshalb schlicht und ergreifend eine persönliche Entscheidung, ob man den Beteuerungen der Anbieter folgt und glaubt, dass nur die Aussagen gespeichert und weiterverwendet werden, die man nach dem Signalwort macht. Darüber hinaus sind die Audiodateien, die an die Amazon- und Google-Data-Center verschickt werden, verschlüsselt. Das sollte die Gefahr reduzieren, dass man sich eine potenzielle Abhörvorrichtung ins Haus holt. Natürlich ist kein System vollkommen sicher. Immerhin haben sowohl Amazon Echo als auch Google Home echte „Stummschalten“-Buttons, um das Mikrofon abzuschalten. Wem das aber immer noch nicht ausreicht, dem bleibt nichts Anderes übrig, als einfach auf diese Devices zu verzichten.

Fazit

Kein Fazit ohne einen schönen Allgemeinplatz! Deswegen diesen zuerst: 2017 wird ein spannendes Jahr – vor allem in puncto Bots und Smart Assistants. Noch ist der Funktionsumfang der verfügbaren Dienste allerdings überschaubar. Doch das wird sich in den nächsten Monaten mit Sicherheit ändern, auch weil es engagierte Communities gibt, die die Assistenten durch selbst entwickelte Skills immer mächtiger machen. Ob ich aber im Jahr 2020 wirklich mehr mit meinem smarten Assistenten spreche als mit meiner Frau? Schau’n mer mal, dann seh’n wir schon! Nein, Quatsch. Das wird meine Frau schon zu verhindern wissen. Aber eins steht auf jeden Fall jetzt schon fest: Ende 2017 werden wir uns definitiv Gedanken darüber machen, was 2018 der heiße Scheiss wird!

