OpenAI: GPT-3 lernt neue Tricks

Avocados im Pyjama: Automatische Bildgenerierung mit DALL·E
Keine Kommentare

Die KI-Schmiede OpenAI wartet wieder einmal mit bis dato unbekannten Möglichkeiten auf: Das GPT-3-basierte neuronale Netzwerk DALL·E erstellt Bilder auf Basis von Text- und Bildeingaben. Die Beispiele zeigen etwa anthropomorphisierte Tiere und Gegenstände in ungewöhnlichen Situationen. Schauen wir sie uns an, denn Bilder sagen bekanntlich mehr als Worte.

Das KI-Forschungsunternehmen OpenAI, das bisher vor allem für automatische Textgenerierung bekannt war, hat nun seine neueste Errungenschaft präsentiert: das neuronale Netzwerk DALL·E. Es bietet verschiedene Möglichkeiten zur automatischen Bildgenerierung auf Basis von Text- und Bildeingaben.

DALL·E kann sowohl zur Transformation bestehender als auch zur Erstellung neuer Bilder oder zum Rendern von Text eingesetzt werden. Zu den Spezialitäten zählt auch das Erstellen von Bildern anthropomorphisierter Tiere und Gegenstände, die mit nicht verwandten Konzepten und Situationen kombiniert werden können.

Avocados, Schaufenster und Telefone

Ein reichhaltiges Sammelsurium an Beispielen bietet der Blogeintrag, in dem DALL·E vorgestellt wurde. Per Klick auf View more or edit prompt unter den Beispielen gelangt man zu einem Dropdown-Menü mit einer Auswahl an vorgefertigten Begriffen – und schon erhält man beispielsweise automatisch generierte Grafiken einer Avocado im Schlafanzug, die einen Schneemann baut:

OpenAI

DALL·E-generierte Bilder einer anthropomorphisierten Avocado (Auswahl); Quelle: https://openai.com/blog/dall-e/

Dort hören die Fähigkeiten von DALL·E aber noch lange nicht auf, denn es ist laut der Beispiele auch in der Lage, etwa „Fotos“ von Schaufensterfronten mit der Aufschrift „OpenAI“ zu generieren oder Katzenfotos in eine Zeichnung zu verwandeln. Und nicht nur das: DALL·E wurde neben geografischem auch mit historischem Wissen gefüttert und kann dadurch beispielsweise verschiedene Telefonarten darstellen, die für unterschiedliche Jahrzehnte typisch sind.

Hier ist jeweils eine Auswahl der Schaufensterfronten und der verschiedenen Telefone zu sehen:

OpenAI

DALL·E-generierte Bilder von „OpenAI“-Schaufenstern; Quelle: https://openai.com/blog/dall-e/

DALL·E-generierte Bilder verschiedener Telefone (Auswahl); Quelle: https://openai.com/blog/dall-e/

DALL·E – das steckt dahinter

Vorbei sind die Zeiten, als OpenAI uns 2019 mit dem Large-Scale Language Model GPT-2 beeindrucken konnte, das in der vollen Version 1,5 Milliarden Parameter besaß und – einem kurzen Input folgend – Texte erzeugen konnte, die wie von Menschenhand geschrieben wirkten. Seitdem wurde fleißig an den Möglichkeiten zur automatischen Texterstellung geschraubt: Der Nachfolger GPT-3, der im September 2020 von Microsoft unter Lizenz gestellt wurde, wartet mit 175 Milliarden Parametern auf.

Das Transformer Language Model DALL·E – ein Portmanteau aus dem Künstler Salvador Dalí und dem Pixar-Roboter WALL·E – ist eine Version von GPT-3 mit 12 Milliarden Parametern. Es wurde entwickelt, nachdem OpenAI bei seinem Projekt Image GPT bereits festgestellt hatte, dass ein großes Transformer Model nicht nur dazu verwendet werden kann, Texte auf Basis eines Trainings mit Texteingaben zu erstellen, sondern ebenso Bilder erzeugt werden können, wenn das Training mit Pixelsequenzen durchgeführt wird. DALL·E vereint diese Fähigkeiten, denn es wird sowohl mit Bildern als auch mit Text trainiert.

Das Unternehmen OpenAI plant, sich künftig mit den möglichen ethischen Auswirkungen eines solchen Modells zu befassen – ein Aspekt, der noch bei GPT-2 sehr viel stärker in den Vordergrund gerückt wurde.

Wir planen, in der Zukunft zu analysieren, wie sich Modelle wie DALL·E auf gesellschaftliche Themen wie die wirtschaftlichen Auswirkungen auf bestimmte Arbeitsprozesse und Berufe, das Potenzial für Bias in den Modell-Outputs und die längerfristigen ethischen Herausforderungen, die diese Technologie mit sich bringt, auswirken.

OpenAI

Das und alles weitere zu DALL·E findet sich im OpenAI-Blogeintrag.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
X
- Gib Deinen Standort ein -
- or -