Deep-Learning-Modell Inception-v3 ist Open Source

TensorFlow: Bilderkennung mit Inception trainieren
Kommentare

Bereits im letzten Jahr hat Google sein Machine-Learning-System TensorFlow Open Source gestellt. Daraufhin erfolgte die Veröffentlichung von Code, der es Usern ermöglichte, Bilder anhand von TensorFlow-Modellen zu klassifizieren. Jetzt hat das Entwickler-Team Libraries und Code quelloffen gemacht, mit denen eigene Image Classifier trainiert werden können.

Mit dem im Dezember veröffentlichten Deep-Learning-Modell Inception-v3 ist es Nutzern erstmals möglich, Bilder anhand von TensorFlow-Modellen zu klassifizieren. Zur Anwendung kommt dabei ein Deep-Learning-Modell, das zuvor für diese Aufgabe trainiert wurde. So gelingt es dem Modell, ein Bild aus 1.000 verschiedenen Kategorien zu erkennen und zu klassifizieren – und das mit einer Fehlerquote, die menschlicher Leistung gleichkommt.

Das Image-Classification-Modell kann dabei nicht nur einen Hund fehlerfrei erkennen, sondern auch zwischen einem Feuersalamander und einem gefleckten Salamander unterscheiden. Erkennt ihr den Unterschied?

Salamander

Salamander, Quelle: http://googleresearch.blogspot.de/2016/03/train-your-own-image-classifier-with.html

Bilderkennung mit Inception-v3

Das Deep-Learning-Modell Inception-v3 erreichte laut Googles eigenen Angaben auf der 2015 ImageNet Challenge den zweiten Rang im Bereich der Bilderkennung. Nach dem Release des Modells wurde in der Community der Wunsch nach einem Inception-v3-Modell laut, das selbst trainiert werden kann. Google ist diesem Wunsch jetzt – nicht ganz uneigennützig – nachgekommen und stellt Libraries und Code zum Training von Inception-v3 Open Source.

Inception-v3 kann auf einer oder mehreren GPUs eingesetzt werden. Zu den Features zählen zum Beispiel das Training eines Inception-v3-Modells mit synchronen Updates über mehrere GPUs hinweg und die Nutzung von Batch Normalization, um den Lernprozess des Modells schneller zu machen. Außerdem lassen sich Veränderungen im Bild dazu nutzen, um das Modell-Training zu verbessern. Indem User auf das vortrainierte Inception-v3-Modell zurückgreifen und dieses für eine neue Aufgabe „feintunen“, lässt sich auch ein Transfer-Lernprozess beobachten und nutzen.

Gleichzeitig veröffentlicht das Google-Team auch die High-Level-Sprache TensorFlow-Slim, die das Spezifizieren von komplexen Modell-Architekturen vereinfachen soll.

Wer direkt mit dem Bilderkennungsprozess starten möchte, findet im zugehörigen Blogpost hilfreiche Anleitungen, wie man ein Netzwerk trainiert, evaluiert und verfeinert.

Was ist TensorFlow?

Das Machine-Learning-System TensorFlow basiert in Teilen auf der Deep-Learning-Infrastruktur DistBelief, wurde an vielen Stellen aber mit umfangreichen Verbesserungen – insbesondere, was die Geschwindigkeit angeht – versehen. TensorFlow zeichnet sich durch seine Flexibilität, leichte Bedienbarkeit und Skalierbarkeit aus. Google selbst nutzt TensorFlow unter anderem für die Spracherkennung in der Google-App, das Smart-Reply-Feature in Inbox oder die Bildersuche in Google Photos.

Aufmacherbild: Fractal Realms series von Shutterstock / Urheberrecht: agsandrew

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -