Facts & Figures für Entwickler: Amazons Sprachenerkennung und Sprachsteuerung

Amazons Alexa Skills Kit – Segen für das IoT?
Kommentare

Das kostenlose Alexa Skills Kit (ASK) von Amazon ist zwar bereits am 25. Juni erschienen, lief bis dato aber etwas unter dem Radar. Mit der Möglichkeit für Drittentwickler, den Sprachassistenten nun in unabhängiger Hardware zu integrieren, könnte Amazon ein wichtiger Schritt im Machtkampf mit Google & Co. gelungen sein. Aus diesem Grund stellen wir euch Alexa heute einmal genauer vor.

Neben Google und Apple ist Amazon der führende Anbieter im Bereich der Sprachenerkennung und Sprachsteuerung. Der intelligente Lautsprecher Echo ist mit dem Sprachassistenten Amazon Alexa ausgestattet: Aktiviert wird Echo, sobald man den Namen Alexa ausspricht. Die Software kann verschiedene Sprachkommandos verstehen und Smart Devices steuern. So sollen beispielsweise ein Wecker gestellt, die Wettervorhersage herausgesucht oder diverse Fragen mithilfe von Internetquellen beantwortet werden können. Natürlich kann Amazon Echo auch Musik abspielen, das dürfte aber eher nebensächlich sein. Das Device läuft auf Amazon Web Services und ist somit cloudbasiert.

Nachdem das Gerät zuerst nur Amazon-Prime-Mitgliedern vorbehalten war, kommen seit dem 23. Juni 2015 alle Amazon-Kunden in den USA zum Zug. Infolgedessen hat Amazon den dahinter stehenden Service am 25. Juni Entwicklern zur Verfügung gestellt. In Deutschland ist Echo aufgrund verschärfter Datenschutzbestimmungen bis jetzt noch nicht erhältlich – wann das Device auf den Markt kommen wird, ist sicher aber nur noch eine Frage der Zeit.

Amazon Alexa Skills Kit

Die Technik hinter Amazon Echo trägt den schönen Namen Alexa – vollständig Alexa Voice Sevice, AVS – und verarbeitet Sprachbefehle via Natural-Language-Processing. Interessierten Entwicklern hat Amazon das Alexa Skills Kit SDK in einer Preview zum Download zur Verfügung gestellt. Damit lassen sich Web-Angebote auch außerhalb von Amazon integrieren, womit sich der Funktionsumfang laut Amazon erheblich erweitert:

Today, we’re making the Alexa Skills Kit available to any developer, maker, or general hobbyist that wants to invent on behalf of customers, creating new skills and capabilities. We can’t wait to see what developers are going to invent with this technology.

Mit Alexa können Entwickler eigene Funktionen („Skills“) erstellen – Usern ist es möglich, mittels AWS-Lambda-Containern oder klassischen Web-Services Anfragen zu erstellen, die dann von Amazons Sprachassistenten entgegengenommen werden. Die Skills basieren auf Java und JavaScript. Als explizites Beispiel für solche Skills nennt Amazon etwa die Möglichkeit, das SDK mit der Schulkantine zu verknüpfen, sodass die Frage nach dem täglichen Schulessen gestellt werden kann und aufgrund der Antwort die Entscheidung für oder gegen ein Lunchpaket gefällt wird. Auch kann über Alexa beispielsweise das Team der eigenen Fantasy-Baseball-League geändert werden: „Alexa, ask Fantasy Baseball to change my lineup and start Felix Hernandez today.“

Da es sich um ein RESTful API handelt, lässt sich theoretisch jeder cloudbasierte Dienst mit dem ASK anpassen. Auch mit Einplatinencomputern wie dem Raspberry Pi ist ASK kompatibel. Falls nicht, hilft der bereits erwähnte Amazon Web Service Lambda, mit dem Entwickler einen Cloud-Dienst inklusive Alexa-Integration erstellen können. Amazon konnte bereits einige Plattformen für sich gewinnen: Pebblebee, Hersteller von bluetoothfähigen Trackern und Sensoren, Glympse, GPS-Location-Sharing-Anbieter, und AOL unterstützen die Plattform mit eigenen Skills für Alexa. Ein spannendes Projekt zum Umgang mit ASK findet sich im Web mit dem JavaScript-Cookbook. Hier werden kurze Codebeispiele vorgestellt, wie das Alexa Skills Set eingesetzt werden kann – so zum Beispiel für das Auslesen eines etymologischen Wörterbuchs oder von Aktienkursen.

Die ersten neuen Einsatzmöglichkeiten, die Entwickler mittels ASK erstellen, werden laut Amazon Ende des Jahres veröffentlicht. Das Alexa Skills Kit steht auf der Amazon Developer Site zum Download bereit.

Einen Einblick in die Möglichkeiten von Amazon Echo und Alexa Skills Kit bietet folgendes Video:

Alexa Voice Service

Gleichzeitig stellt Amazon Drittherstellern von Hardware auch kostenlos nutzbare Tools, APIs und Codebeispiele für den Alexa Voice Service zur Verfügung, sodass diese Alexa in ihre Devices integrieren können. Genauso, wie man mit Amazon Echo kommuniziert und diesem Anweisungen gibt, ist es nun möglich, Alexa in fremde Geräte zu integrieren – beispielsweise könnte ein Hersteller von WLAN-Weckern ein Alexa-fähiges Device entwickeln, dass Fragen nach dem Wetter oder dem Zeitpunkt des ersten Meetings beantwortet. Der Sprachassistent erlaubt Zugriff auf Informationen, Musik, Nachrichten, Wetter, Verkehrsmeldungen und vieles mehr.

Der Vorteil von AVS liegt für Amazon in der einfachen und intuitiven Bedienung mit natürlicher Sprache, ohne auf zusätzliche Geräte oder manuelle Befehlseingabe angewiesen zu sein. Zudem sei Alexa Voice Service als Cloud-Dienst problemlos skalierbar, ohne dass Entwickler sich um die Infrastruktur sorgen müssten. Auch die Integration soll laut Amazon einfach vonstattengehen:

No experience with voice recognition or Natural Language Understanding (NLU) is required. Using AVS, add Alexa to your device in just a few hours. Leave understanding human speech to us and focus on your differentiated value add to customers.

Wie beim ASK handelt es sich um eine Preview-Version, sodass in nächster Zeit nicht damit zu rechnen sein dürfte, dass eine Hardwarepalette mit Alexa-Integration auf den Markt kommt. Wer mit AVS experimentieren möchte, muss sich zuerst einen Amazon-Developer-Account anlegen – danach kann es im Alexa-Developer-Portal losgehen.

Amazon Alexa: Chance für das Internet of Things

… und Gewinner im Rennen gegen Google & Co.

Zusammengenommen bieten AVS und ASK Entwicklern viele spannende Einsatzmöglichkeiten, gerade für das Internet of Things. Durch die Öffnung für Drittentwickler schafft Amazon gute Voraussetzungen, um seinen Sprachassistenten in einem vielseitigen Ökosystem von Geräten zu integrieren – während Apple und Google auf wenige Gerätetypen setzen. Wie Jack Wallen richtig bemerkt, hat Amazon – anders als Google mit Google Now – Entwicklern Tür und Tor geöffnet, frei nach Motto: Jeder kann ein Gerät entwickeln, das sich mit dem Internet of Things verbindet. Auf diese Weise kann und wird Amazon wohl die eigene Technologie voranbringen, denn auch der hauseigene Cloud-Dienst profitiert von einer umfangreichen Nutzung: Dank Machine Learning entwickelt sich das System kontinuierlich weiter.

Als weiteren Anreiz investiert Amazon 100 Millionen Dollar in den Alexa Fund, der Entwickler, Hersteller und Startups dabei unterstützen soll, innovative Konzepte mit ASK und AVS zu entwickeln. Damit soll allerdings nicht nur die Integration von Alexa in andere Produkte gefördert werden:  Entwickler sollen so auch die Funktionen der Sprachsteuerung erweitern können, wovon wiederum Amazon profitieren würde.

Wovon Amazon auf jeden Fall profitiert, sind die so gewonnenen Nutzerdaten: Gerade dadurch, dass ein Sprachassistent Einzug ins Privatleben hält. Allerdings besteht zumindest die potenzielle Gefahr, dass Gespräche abgehört werden. Amazon versichert zwar, dass Aufzeichnungen nur dann erfolgen, sobald das Keyword „Alexa“ genannt wird – jedoch befindet sich die Software beständig im Zuhörmodus, um mitzubekommen, wann das Aktivierungswort genannt wird. Durch die Vernetzung mit weiteren smarten Geräten sind natürlich auch diese anfällig für Cyberkriminalität, sodass hier besonders auf eine gute Sicherung der Soft- und Hardware geachtet werden sollte.

Fazit

Obwohl Amazons Konkurrenten ebenfalls über sehr mächtige Tools zur Spracherkennung verfügen, hat Amazon mit ASK gute Chancen, die Rivalen hinter sich zu lassen. Denn seit seiner Veröffentlichung hat Amazon Echo bereits guten Anklang bei Entwicklern gefunden. So haben umtriebige Developer die Echo und Alexa SDKs bereits erfolgreich implementiert, um beispielsweise smarte Beleuchtung zu steuern, Thermostate von Nest zu regeln und unzählige weitere Home-Automation-Anwendungen durchzuführen. Alles Anwendungsszenarien, die aufgrund fehlender SDKs mit Google Now, Apples Siri oder Microsofts Cortana schlichtweg nicht möglich sind. Es besteht also eine gute Chance, dass Amazons Alexa den Weg in eine Welt bereitet, in der es normal sein wird, wie Star Treks Scotty mit einem Computer zu sprechen:

 

Aufmacherbild: Amazon Echo, the voice recognition streaming device from Amazon von Shutterstock / Urheberrecht: George W. Bailey

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -