Mächtige Bilderkennungsfunktion aus Mountain View

Google stellt Cloud Vision API Entwicklern zur Verfügung
Kommentare

Habt ihr euch auch schon des Öfteren gefragt, wie Google Photos eigentlich alle eure Lieblingshundefotos findet? Das Cloud Vision API ist dafür verantwortlich. Google hat seine Bilderkennungsfunktion jetzt Entwicklern zur Verfügung gestellt.

Mit dem Release des Cloud Vision API hat Google Entwicklern ein mächtiges Werkzeug zur Verfügung gestellt. Denn mit dem Tool können Developer Applikationen entwickeln, die den Inhalt von Bildern nicht nur erkennen, sondern – viel wichtiger – verstehen können. Das API soll zwischen tausenden von Kategorien unterscheiden und zielsicher die Emotionen hinter einem Gesichtsausdruck identifizieren können.

Was kann das Cloud Vision API?

Fortschritte im Machine Learning, angefeuert von Plattformen wie TensorFlow, haben Rechenmodelle zu Tage gefördert, die den Inhalt eines Bildes vorhersagen können. Mit dem Cloud Vision API soll nun eine wesentlich genauere Erkennung von Bildinhalten möglich sein. Mit dem API lassen sich Metadaten für Bilder  und ganze Bilderkatalog erstellen und anstößige Inhalte moderieren. Auch etwaig im Bild vorhandene Emotionen, in der Regel in Gesichtern, werden erkannt und könnten neue Marketingszenarien eröffnen.

Derzeit hat das Cloud Vision API noch den Status „limited preview“, aber Entwickler können auf die anspruchsvollen Rechenmodelle über ein einfaches REST-API zugreifen. Indem ein Bild im Request embedded wird, lässt sich der API-Call auslösen und so verschiedene Typen von Anmerkungen zum Bild anfordern. Google unterscheidet sechs verschiedene Features des Cloud Vision API:

  • Label/Entity Detection: Ermittlung des zentralen Objekts im Bild
  • Optical Character Recognition: Sucht nach Texten im Bild und versucht, diese zu verstehen
  • Safe Search Detection: Ermittlung von anstößigem Inhalt
  • Facial Detection: Gesichtserkennung
  • Landmark Detection: Identifikation von bekannten Natur- und Baudenkmälern
  • Logo Detection: Erkennen von Logos und Zuordnung zu einer Marke
Cloud Vision API

© Google

In der Zukunft ist auch eine Integration mit Google Cloud Storage vorgesehen. Als ersten externen Tester des Cloud Vision API nennt Google Aerosense, eine Tochter von Sony Mobile. Sie wertet mit den Algorithmen Drohnenbilder in großer Zahl automatisch aus.


Das Cloud Vision API steht in der

eingeschränkten Preview über die Google Cloud Platform zur Verfügung. Was mit dem Cloud Vision API alles möglich ist, zeigt folgendes Video:

 

Aufmacherbild: blurry vision of a seashore on a beautiful summer day and a hand holding a pair of glasses that correct the vision von Shutterstock / Urheberrecht: grufnar

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -