Googles Cloud Vision API überträgt das Konzept des maschinellen Lernens erstmalig auf Bilder. Das API soll zwischen tausenden von Kategorien unterscheiden und zielsicher die Emotionen hinter einem Gesichtsausdruck identifizieren können. Mit dem Beta-Release des Google Cloud Vision API kann nun jeder Bilder an das API übermitteln, das dann den Inhalt des Bilds wiedergibt und versteht. Dabei ist das Cloud Vision API nicht nur in der Lage, Alltagsgegenstände zu erkennen, sondern kann auch Text innerhalb des Bilds lesen oder Produktlogos identifizieren.
Features der Beta des Cloud Vision API
Das Beta-Release des Cloud Vision API ermöglicht den Zugriff auf das API, das auf eine Vielzahl von im Google Cloud Storage gespeicherten Bildern zurückgreifen kann. Zudem können Bilder als Teil des API-Requests eingebunden werden. Das Cloud Vision API unterstützt verschiedene Szenarien: So können beispielsweise Einblicke in Bilder gewonnen werden, da das API eine umfassende Menge von Objekten in Bildern erkennen und zuordnen kann – von Blumen bis hin zu bekannten Sehenswürdigkeiten. Neu ist die Fähigkeit, die vorherrschende Farbe in einem Bild zu erkennen.
Außerdem ist das Cloud Vision API in der Lage, anstößigen Inhalt aufzuspüren und zu melden. Auch Gefühle sind für das API kein Fremdwort: Es kann Emotionen wie Freude, Trauer und Ärger in Gesichtern erkennen. Zudem erlaubt die Optical Character Recognition (OCR) das Finden von Text in Bildern sowie eine automatische Spracherkennung.
Google hat zeitgleich mit der Veröffentlichung der Beta ein Preismodell angekündigt: Entwickler können monatlich bis zu 1000 Bilder kostenlos durch das Cloud Vision API jagen, danach wird für jede weitere Einheit von 1000 Bildern ein Betrag zwischen 2,50 Dollar und fünf Dollar fällig – je nach Aufwand. Bei einer großen Anzahl von Bildern gewährt Google auch Rabatt: Ab fünf Millionen Bildern bewegen sich die Preise zwischen 0,60 und zwei Dollar. Während der Beta-Phase gibt es eine Obergrenze von 20 Millionen Bildern pro Monat.
Seit der Veröffentlichung der Limited Preview im Dezember haben laut Google tausende von Firmen das Cloud Vision API genutzt, darunter die Fotobearbeitungs- und Brandingapp PhotoFy und das soziale Netzwerk Yik Yak. Das Cloud Vision API steht auf der Projektwebsite zum Testen zur Verfügung; dort finden sich auch die Dokumentation und Tutorials.
Efficient Transformers
Christoph Henkelmann, DIVISIO
Enhancing Page Visits by Topic Prediction
Dieter Jordens, Continuum Consulting NV
Machine Learning on Edge using TensorFlow
Håkan Silfvernagel, Miles AS
Aufmacherbild: out of focus business building and fingers creating a square making the vision clear von Shutterstock / Urheberrecht: grufnar