Bilderkennungsfunktion erhält neue Features

Google Cloud Vision API erreicht Beta-Status
Kommentare

Google hat einen weiteren wichtigen Schritt im Feld der künstlichen Intelligenz gemacht: Das Cloud Vision API steht ab sofort in der Beta-Version zur Verfügung. Bereits seit Dezember ist die Bilderkennungsfunktion als Limited Preview im Einsatz und ermöglicht das Entwickeln von Applikationen, die den Inhalt von Bildern erkennen und verstehen können.

Googles Cloud Vision API überträgt das Konzept des maschinellen Lernens erstmalig auf Bilder. Das API soll zwischen tausenden von Kategorien unterscheiden und zielsicher die Emotionen hinter einem Gesichtsausdruck identifizieren können. Mit dem Beta-Release des Google Cloud Vision API kann nun jeder Bilder an das API übermitteln, das dann den Inhalt des Bilds wiedergibt und versteht. Dabei ist das Cloud Vision API nicht nur in der Lage, Alltagsgegenstände zu erkennen, sondern kann auch Text innerhalb des Bilds lesen oder Produktlogos identifizieren.

Features der Beta des Cloud Vision API

Das Beta-Release des Cloud Vision API ermöglicht den Zugriff auf das API, das auf eine Vielzahl von im Google Cloud Storage gespeicherten Bildern zurückgreifen kann. Zudem können Bilder als Teil des API-Requests eingebunden werden. Das Cloud Vision API unterstützt verschiedene Szenarien: So können beispielsweise Einblicke in Bilder gewonnen werden, da das API eine umfassende Menge von Objekten in Bildern erkennen und zuordnen kann – von Blumen bis hin zu bekannten Sehenswürdigkeiten. Neu ist die Fähigkeit, die vorherrschende Farbe in einem Bild zu erkennen.

Quelle: bit.ly/1Q4V9IR

Quelle: bit.ly/1Q4V9IR

Außerdem ist das Cloud Vision API in der Lage, anstößigen Inhalt aufzuspüren und zu melden. Auch Gefühle sind für das API kein Fremdwort: Es kann Emotionen wie Freude, Trauer und Ärger in Gesichtern erkennen. Zudem erlaubt die Optical Character Recognition (OCR) das Finden von Text in Bildern sowie eine automatische Spracherkennung.

Quelle: bit.ly/1Q4V9IR

Quelle: bit.ly/1Q4V9IR

Google hat zeitgleich mit der Veröffentlichung der Beta ein Preismodell angekündigt: Entwickler können monatlich bis zu 1000 Bilder kostenlos durch das Cloud Vision API jagen, danach wird  für jede weitere Einheit von 1000 Bildern ein Betrag zwischen 2,50 Dollar und fünf Dollar fällig – je nach Aufwand. Bei einer großen Anzahl von Bildern gewährt Google auch Rabatt: Ab fünf Millionen Bildern bewegen sich die Preise zwischen 0,60 und zwei Dollar. Während der Beta-Phase gibt es eine Obergrenze von 20 Millionen Bildern pro Monat.

Seit der Veröffentlichung der Limited Preview im Dezember haben laut Google tausende von Firmen das Cloud Vision API genutzt, darunter die Fotobearbeitungs- und Brandingapp PhotoFy und das soziale Netzwerk Yik Yak. Das Cloud Vision API steht auf der Projektwebsite zum Testen zur Verfügung; dort finden sich auch die Dokumentation und Tutorials.

 

Aufmacherbild: out of focus business building and fingers creating a square making the vision clear von Shutterstock / Urheberrecht: grufnar

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -