Vom Graphical UI zum Conversational UI
Vom Graphical UI zum Conversational UI
Intelligente Systeme, die dem Menschen immer ähnlicher werden, wecken in jüngster Zeit nicht nur das Interesse von Filmemachern. Anwendungen, die auf künstlichen Intelligenzen basieren, und mit emotionalen Kompetenzen ausgestattet sind, wie Sprachassistenten und Chatbots, krempeln das Feld der User Experience aktuell gehörig um. Beschreiben lässt sich die Entwicklung als Wandel vom Graphical UI zum Conversational UI (CUI). Bei der Gestaltung von CUIs sind AI-Persönlichkeiten die neue Schlüsselgröße einer guten Conversational UX. Allerdings bedroht das Misstrauen der Nutzer gegenüber künstlichen Intelligenzen einen weiteren wichtigen UX-Faktor: das Vertrauen.
Der schüchterne und introvertierte Theodore Twombly schreibt beruflich Liebesbriefe für Menschen, denen es schwerfällt, ihre Gefühle in Worte zu fassen. Obwohl sein Beruf ein hohes Maß an Empathie verlangt, ist es um sein eigenes Liebesleben eher schlecht bestellt. Das ändert sich erst, als er eine neue Sprachsoftware, die auf den Namen „Samantha“ hört, installiert. Das Betriebssystem bezieht Informationen aus Theodores sozialen Interaktionen, lernt schnell dazu und wird zunehmend menschlicher. Auf diese Weise entwickelt sich zwischen ihnen auf Basis sprachlicher Kommunikation eine intime Mensch-Maschinen-Beziehung.
Das ist die Rahmenhandlung des 2013 erschienen US-amerikanischen Science-Fiction-Filmdramas „Her“. Die Idee, menschähnliche Systeme auf Basis künstlicher Intelligenzen zu entwickeln, ist jedoch nicht sonderlich neu. Frühere Beispiele sind das HAL-9000 aus „2001: A Space Odyssey“ oder das WORP aus „WarGames“. Neu hingegen ist, dass die Grenze zwischen Mensch und Maschine auch auf emotionaler Ebene mehr und mehr zu verschwimmen beginnt.
Die Entwicklung wurde jüngst in „Ex Machina“ auf die Spitze getrieben. Der reiche und exzentrische Firmengründer Nathan entwickelt auf seinem abgeschiedenen Anwesen einen weiblichen Androiden namens Ava. Um ihr Denkvermögen zu testen, lässt er den jungen Programmierer Caleb einfliegen. Im Laufe der Zeit schafft es Ava, Caleb derart in ihren Bann zu ziehen, dass er ihr sogar zur Flucht verhelfen will.
Die Sozialphilosophie lehrt, dass ästhetische Werke den Zeitgeist einer Epoche mitunter besser einfangen können als empirische Erhebungen oder Datenanalysen. Fiktive Systeme wie HAL-9000 und das WORP besitzen tatsächlich starke Parallelen zu realen Anwendungen wie dem Computerprogramm ELIZA oder dem Computerspiel Zork, deren Entwicklungszeiten etwa mit den Veröffentlichungsterminen der Filme zusammenfallen.
Daher ist es womöglich nicht bloßer Zufall, dass menschenähnliche, intelligente Systeme abermals verstärkt das Interesse von Filmemachern wecken. In den vergangenen Jahren ist die Entwicklung im Bereich der AI rasant vorangeschritten, sodass Anwendungen mit emotionaler Kompetenz keine bloße Zukunftsmusik mehr sind.
Maschinen fällt es zunehmend leichter, die menschliche Sprache zu verstehen.
Beispielsweise gibt es erhebliche Fortschritte in der Sprachverarbeitung. Den Maschinen fällt es zunehmend leichter, die menschliche Sprache zu verstehen. Weitere Indizien sind AI-Projekte wie Googles Knowledge Graph oder Wolfram Alpha. Und nicht zuletzt hat die massenhafte Verbreitung mobiler Endgeräte dafür gesorgt, dass nahezu jeder eine intelligente Maschine mit aktiver Internetanbindung mit sich herumträgt.
Wie damals HAL-9000 und WORP stehen heute Samantha und Ava stellvertretend für eine reale Entwicklung, die sich am besten als Übergang vom Graphical User Interface zum Conversational Interface beschreiben lässt.
Ein Graphical User Interface (GUI) dient dazu, Anwendungssoftware mittels grafischer Elemente und Symbole bedienbar zu machen. Das grafische Interface übersetzt sozusagen die menschliche Sprache in Muster und Befehle, die von den Maschinen verstanden werden können. Demgegenüber versuchen Conversational User Interfaces (CUI) die Konversation mit einer realen Person zu imitieren. Statt Buttons zu drücken oder Syntax-Befehle zu geben, erfolgt die Kommunikation mit dem System direkt per Text oder Sprache. Zurzeit gibt es zwei unterschiedliche Möglichkeiten, diese Art der Eingabe zu realisieren. Einerseits kann auf Sprachassistenten wie Siri, OK Google, Echo oder Cortana zurückgegriffen werden. Andererseits besteht die Möglichkeit, Chatbots wie Facebooks M, Slackbot oder Howdy einzusetzen.
In Zeiten, in denen Inhalte nicht nur auf ein Gerät zugeschnitten sein dürfen, sondern geräte- und plattformübergreifend dargestellt sowie situationsspezifisch aufbereitet werden müssen, sind CUIs die Cross-Plattform schlechthin. Sie funktionieren auf Desktop-PCs, Smartphones, Smartwatches und sogar auf Geräten, die kein Display besitzen (Amazon Echo). Außerdem können sie in unterschiedliche Services wie Twitter, Facebook oder Snapchat integriert werden. So ist es bereits jetzt möglich, eine Fahrt per Uber zu buchen, ohne hierfür den Facebook Chat verlassen zu müssen.
Eine intuitivere Bedienung gibt es kaum!
Außerdem sind CUIs einfach zu pflegen und zu warten. Ihr Algorithmus kann ohne die Bereitstellung regelmäßiger Softwareupdates ständig verbessert werden. Gegenüber herkömmlichen Interfaces sind jedoch die niedrigen Einstiegshürden die wahre Stärke von Conversational User Interfaces. Nahezu jeder Nutzer weiß, wie man spricht oder chattet. Um CUIs bedienen zu können, müssen sich die User kein neues Wissen aneignen oder sich mit einer Plattform vertraut machen: Eine intuitivere Bedienung gibt es kaum!
Die Umstellung auf Sprach- und Chat-Funktionen befreit Designer zudem von der Aufgabe, sämtliche Features und Funktionen einer Applikation oder Anwendung in einem Menü unterbringen oder durch ein Icon repräsentieren zu müssen. Wie eine Studie ergab, fühlen sich 41 Prozent der User von E-Commerce-Angeboten von der Vielzahl der Wahlmöglichkeiten bereits jetzt überfordert. Chatbots können hier Abhilfe schaffen, indem sie den günstigsten Flug raussuchen oder das passende Sneakerpaar bestellen. Ein weiteres Einsatzgebiet ist die Unterstützung und Automatisierung von Kommunikations- und Kollaborationsprozessen im Netz.
Sprachassistenten und Chatbots hieven die UX-Technik des Storytellings auf eine neue Stufe. Sie erzählen eine gute und kohärente Geschichte, nur verzichten sie dabei völlig auf eine entsprechende optische Visualisierung und geben sich schon mit einem einfachen Eingabefenster zufrieden. Die Programmierung eines entsprechenden Bots ist auch keine Rocket Science mehr und wird durch Tools und Libraries wie Twine, Wit.ai, Beep Boop oder Botkit vereinfacht.
Die Zukunft der User Experience liegt daher in zeitsensitiven Interaktionen.
Sprach- und Textfunktionen erlauben es also, auf eine visuelle Gestaltung nahezu vollständig zu verzichten. Form folgt Funktion: So lässt sich der Wandel vom UI- zum UX-Design zusammenfassen. Bei CUIs tritt die Form nun restlos in den Hintergrund. Der Content gibt nicht länger die optische Umsetzung vor, sondern der Content wir selbst zum visuellen Medium. Die Lernfähigkeit künstlicher Intelligenzen macht es darüber hinaus möglich, dass sich die Softwares im Laufe der Zeit sogar selbstständig auf die Wünsche und Bedürfnisse der Nutzer einstellen.
Die Zukunft der User Experience liegt daher in zeitsensitiven Interaktionen. Die User müssen zur richtigen Zeit automatisch mit denjenigen Informationen versorgt werden, die sie benötigen, um eine Aktion in der Reihenfolge durchzuführen, in der sie durchgeführt werden muss. Gelingt das, dann sind CUIs responsiver und adaptiver als jede existierende Applikation oder Webseite. Weder müssen Apps eigenständig heruntergeladen noch visuelle Symbole wie das Hamburger-Icon zu Navigationszwecken herangezogen werden. Probleme beim Onboarding und hohe Bounce-Raten stellen dann ebenfalls keine Schwierigkeiten mehr da.
Allerdings funktionieren Sprachassistenten und Chatbots nur selten völlig unabhängig von anderen Applikationen und Plattformen. Der Grund dafür liegt darin, dass viele Dienstleistungen, wie etwa Maperservices, nach wie vor am besten per visueller Steuerung statt via Sprach- oder Textbefehl funktionieren. Eine der größten Herausforderung für Designer wird demzufolge darin bestehen, die Features und Funktionen von GUIs sinnvoll in CUIs zu integrieren oder zu übertragen. Denn ein schlecht programmierter Bot besitzt das gleiche Frustrationspotenzial wie ein schlecht gestaltetes Interfaces.
Das ist aber nicht die einzige Aufgabe, vor der Designer stehen. Weitere Anpassungsleistungen sind nötig, da durch adaptive Systeme bewährte Patterns, Flows und Steuerelemente ihre Funktion verlieren werden. Rapides Prototyping und iterative Prozesse, die auf dem Echtzeit-Feedback der Nutzer basieren, werden Aufgabenbereiche komplimentieren oder erprobte Praktiken ganz ersetzen. In Zukunft wird es nicht mehr so wichtig sein, visuelle Elemente zu entwerfen, sondern künstliche Persönlichkeiten zu konzipieren.
Denn ein schlecht programmierter Bot besitzt das gleiche Frustrationspotenzial wie ein schlecht gestaltetes Interfaces.
Bei der Gestaltung von Conversational User Interfaces ist die AI-Persönlichkeit die neue User Experience. Es sind daher künftig Skills und Fähigkeiten gefragt, die voraussichtlich zu neuen Jobtiteln wie „Conversational User Experience Designer“ oder „Human Experience Designer“ führen. Schon heute hängt die Entwicklung einer guten Conversational UX im entscheidenden Maße davon ab, welche Art von Persönlichkeit die AI-Interaktionspartner besitzen.
So werden Sprachassistenten in der Regel mit einem Geschlechtsmerkmal wie einer weiblichen oder männlichen Stimme versehen, um das Vertrauen der User zu gewinnen. Doch trotz solcher Versuche trauen viele Nutzer künstlichen Intelligenzen bisher nicht über den Weg. Automatisierte Interaktionen werden als unerwünschte Eingriffe statt willkommene Ergänzungen gewertet. Verstärkt wird dieser Effekt dadurch, dass so mancher generierter Vorschlag noch äußerst skurrile Stilblüten trägt.
Das ist insofern ein Problem, da der Erfolg der User Experience auf der Etablierung einer vertrauensvollen und emotionalen Bindung zu den Anwendern basiert. Nur wegen dieser Tatsache konnte die UX den funktionalen User Interfaces den Rang ablaufen. Dieser Vorteil droht nun angesichts des Misstrauens der Nutzer gegenüber künstlichen Intelligenzen wieder verspielt zu werden.
Dass die Anwender AI-Persönlichkeiten skeptisch gegenüberstehen, liegt unter anderem daran, dass Systeme wie Samantha und Ava als Vorlagen bei der Entwicklung künstlicher Intelligenzen dienen: Sie repräsentieren menschenähnliche Persönlichkeiten, die mit nahezu unbeschränkten Wissen ausgestattet sind. Ein Fakt, der viele Nutzer fasziniert und zugleich abschreckt.
Theodore und Caleb mussten ihre Faszinationen für Samantha und Ava am Ende teuer bezahlen. Die Skepsis der Nutzer vor allmächtiger Software scheint demnach berechtigt. Aber warum werden Chatbots und Sprachasisstenten trotz besseren Wissens weiterhin benutzt? Weil ihr Aufstieg gerade nicht darauf zurückzuführen ist, dass künstliche Intelligenzen endlich den Turing-Test bestehen. Vielmehr haben gerade die Unzulänglichkeiten heutiger AIs den Weg für die Entwicklung bereitet: Die Anwender interagieren mit adaptiven Systemen, da sie wissen, dass Computer dahinterstecken. Die vermeintlich ärgste Schwachstelle von AIs ist im Bereich der User Experience ihre größte Stärke.
Eine gute Conversational UX ist nicht auf einen möglichst allwissenden, humanoiden Interaktionspartner angewiesen.
Eine gute Conversational UX ist nicht auf einen möglichst allwissenden, humanoiden Interaktionspartner angewiesen. Dieses Paradigma als Grundlage zu wählen, gefährdet die UX vielmehr. Der Astrotech-Droide R2-D2 aus „Star Wars“ und der KI-gesteuerte Roboter TARS aus „Interstellar“ zeigen, wie Roboter auf Menschen sympathisch und vertrauenerweckend wirken. Statt Göttern aus der Box zu ähneln, müssen sie nur bleiben, was sie sind: nämlich Roboter – kleine, kluge Begleiter, die innerhalb ihres beschränkten Horizonts einfallsreich und hartnäckig sind.
AI-Persönlichkeiten sind der Schlüssel zu einer guten Conversational User Experience. Das Vertrauen in künstliche Intelligenzen beginnt dort, wo die Maschinen sich als Computer mit Ecken und Kanten zu erkennen geben. Eine gute Conversational UX zeichnet sich demnach nicht durch menschähnliche, sondern durch botähnliche (nicht: gottähnliche!) AI-Persönlichkeiten aus. Denn auf die Frage, was passiert, wenn die Maschinen den Menschen zu ähnlich werden, hat das Kino auch eine passende Antwort parat: Hasta la vista, baby!
Aufmacherbild: R2D2 at the Star Wars Celebration via Shutterstock / Urheberrecht: fotoearl