Mit dem im Dezember veröffentlichten Deep-Learning-Modell Inception-v3 ist es Nutzern erstmals möglich, Bilder anhand von TensorFlow-Modellen zu klassifizieren. Zur Anwendung kommt dabei ein Deep-Learning-Modell, das zuvor für diese Aufgabe trainiert wurde. So gelingt es dem Modell, ein Bild aus 1.000 verschiedenen Kategorien zu erkennen und zu klassifizieren – und das mit einer Fehlerquote, die menschlicher Leistung gleichkommt.
Das Image-Classification-Modell kann dabei nicht nur einen Hund fehlerfrei erkennen, sondern auch zwischen einem Feuersalamander und einem gefleckten Salamander unterscheiden. Erkennt ihr den Unterschied?

Salamander, Quelle: http://googleresearch.blogspot.de/2016/03/train-your-own-image-classifier-with.html
Bilderkennung mit Inception-v3
Das Deep-Learning-Modell Inception-v3 erreichte laut Googles eigenen Angaben auf der 2015 ImageNet Challenge den zweiten Rang im Bereich der Bilderkennung. Nach dem Release des Modells wurde in der Community der Wunsch nach einem Inception-v3-Modell laut, das selbst trainiert werden kann. Google ist diesem Wunsch jetzt – nicht ganz uneigennützig – nachgekommen und stellt Libraries und Code zum Training von Inception-v3 Open Source.
Inception-v3 kann auf einer oder mehreren GPUs eingesetzt werden. Zu den Features zählen zum Beispiel das Training eines Inception-v3-Modells mit synchronen Updates über mehrere GPUs hinweg und die Nutzung von Batch Normalization, um den Lernprozess des Modells schneller zu machen. Außerdem lassen sich Veränderungen im Bild dazu nutzen, um das Modell-Training zu verbessern. Indem User auf das vortrainierte Inception-v3-Modell zurückgreifen und dieses für eine neue Aufgabe „feintunen“, lässt sich auch ein Transfer-Lernprozess beobachten und nutzen.
Gleichzeitig veröffentlicht das Google-Team auch die High-Level-Sprache TensorFlow-Slim, die das Spezifizieren von komplexen Modell-Architekturen vereinfachen soll.
Wer direkt mit dem Bilderkennungsprozess starten möchte, findet im zugehörigen Blogpost hilfreiche Anleitungen, wie man ein Netzwerk trainiert, evaluiert und verfeinert.
Was ist TensorFlow?
Das Machine-Learning-System TensorFlow basiert in Teilen auf der Deep-Learning-Infrastruktur DistBelief, wurde an vielen Stellen aber mit umfangreichen Verbesserungen – insbesondere, was die Geschwindigkeit angeht – versehen. TensorFlow zeichnet sich durch seine Flexibilität, leichte Bedienbarkeit und Skalierbarkeit aus. Google selbst nutzt TensorFlow unter anderem für die Spracherkennung in der Google-App, das Smart-Reply-Feature in Inbox oder die Bildersuche in Google Photos.
Efficient Transformers
Christoph Henkelmann, DIVISIO
Enhancing Page Visits by Topic Prediction
Dieter Jordens, Continuum Consulting NV
Machine Learning on Edge using TensorFlow
Håkan Silfvernagel, Miles AS
Aufmacherbild: Fractal Realms series von Shutterstock / Urheberrecht: agsandrew
[…] Trend folgend Machine-Learning-Lösungen anzubieten: In den letzten Monaten hat Google bereits TensorFlow und zugehörige Komponenten sowie das Cloud Vision API Entwicklern zu Verfügung […]
[…] Deep-Learning-Modell Inception v3 ist aus dem Bereich der Bilderkennung bekannt, in dem es bereits erstaunliche Resultate lieferte: […]
[…] Bereich freuen. Alleine schon deswegen, weil der Allgemeinheit Machine-Learning-Bibliotheken wie TensorFlow Open Source zur Verfügung stehen. So hat beispielsweise Entwickler David Garcia mit „srez“ ein […]