• AI Peanuts
  • Posts
  • OpenAI stellt DALL·E 3 vor - mit zwei entscheidenden Neuerungen!

OpenAI stellt DALL·E 3 vor - mit zwei entscheidenden Neuerungen!

OpenAI war mit dem ursprünglichen DALL·E, das 2021 veröffentlicht wurde einer der Vorreiter bei generativen Bildern. Doch nachdem auch das Nachfolgemodell nicht wirklich mit der Konkurrenz von Stable Diffusion (Open Source) und Midjourney mithalten konnte, war das Tool schon fast in Vergessenheit geraten.

Die neuste Version, die OpenAI diese Woche angekündigt hat, könnte das ändern, denn DALL·E 3 bringt gleich zwei spannende Neuerungen mit sich:

ChatGPT als Interface & Bye Bye Prompt Engineering

Statt dem bisher gewohnten Interface, bei dem man nur einen Prompt eingibt und daraus ein Bild generiert wird, basiert DALL·E 3 jetzt von Anfang an auf ChatGPT. Man braucht also nicht mehr ewig komplexe Prompts zu “engineeren”, um gute Ergebnisse zu erzielen, sondern teilt seine Ideen und Vorstellungen einfach in natürlicher Sprache mit ChatGPT, das daraus dann automatisch im Hintergrund einen geeigneten Prompt für DALL·E schreibt.

Das ermöglicht außerdem ein deutlich iterativeres Vorgehen beim Erstellen von Bildern, da ChatGPT mit DALL·E die bisherigen Bilder immer, wie beim Text auch, im Kontext behält.

DALL·E erzeugt sinnvollen Text

Wenn man KI genutzt hat um Bilder zu erzeugen, auf denen Text vorkam, sah man bisher vor allem seltsamen Wortsalat. DALL·E macht jetzt einen großen Schritt und kann Text in großen Teilen klar und richtig darstellen.

Das gilt zumindest für große Überschriften und Kernbestandteile des Bilds. Hier ist ein Beispiel, was das Tool auf Basis der Beschreibung “An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote 'Find the universe within you' is etched in bold letters across the horizon.“ auswirft:

Wann und wie wird DALL·E verfügbar sein?

Aktuell ist das Tool in einer geschlossenen “Research Preview”, wird aber im Laufe des Oktobers für ChatGPT Plus und Enterprise Nutzer ausgerollt.