OpenAI hat soeben das neue ChatGPT Images gestartet – mit einem ganz klaren Ziel: Es mit Googles Phänomen Nano Banana Pro aufzunehmen

OpenAI möchte die zuletzt entstandene Lücke zu Google schließen.

Mit dem neuen Bildmodell lassen sich verschiedene Transformationen generieren. (Bild: OpenAI) Mit dem neuen Bildmodell lassen sich verschiedene Transformationen generieren. (Bild: OpenAI)

OpenAI war im großen KI-Rennen zuletzt etwas hinter Google zurückgefallen und versucht jetzt, die Lücke zu schließen. Nach dem vorgezogenen Release von GPT-5.2 wurde jetzt mit ChatGPT Images auch ein verbessertes Modell zur Bilderstellung veröffentlicht.

Auf den Spuren von Nano Banana Pro

Google hat zuletzt vermehrt für Aufsehen gesorgt. Das neue KI-Modell Gemini 3 Pro lässt die Konkurrenz alt aussehen und der KI-Bildgenerator Nano Banana Pro war nach dem Launch so beliebt, dass Google den Zugriff einschränken musste.

Video starten 0:55 ChatGPT Images: OpenAI stellt neues KI-Modell zur Bildbearbeitung vor

Dazu kamen Berichte, dass ChatGPT im Vergleich zu Gemini schon seit geraumer Zeit deutlich langsamer wächst, was sicherlich auch an der sowieso schon komfortablen Markt-Situation zusammenhängt. Das alles soll dazu geführt haben, dass bei OpenAI intern der »Code Red« ausgerufen wurde.

In der Folge soll sich der Fokus wieder stärker auf die Weiterentwicklung der KI-Modelle verschoben haben. Das erste Ergebnis davon war GPT-5.2, das nur einen Monat nach GPT-5.1 veröffentlicht wurde. Das Zweite sind nun ChatGPT Images und das neue Bildmodell.

Bei Images handelt es sich letztlich »nur« um eine dedizierte Umgebung für das Erstellen von Bildern. In der App und auf der Webseite ist jetzt bei den Chats auch der Menüpunkt »Bilder« zu finden. Dort werden auch schon ein paar Möglichkeiten vorgestellt.

Deutlich spannender sind vermutlich die Verbesserungen, die OpenAI dem KI-Bildgenerator verpasst haben will. Diese erinnern nicht zufällig an die Neuerungen, die Nano Banana Pro geboten hat:

  • Präzise Edits auch über mehrere Bilder hinweg: Bilder können umfangreich angepasst, verbessert und verändert werden
  • Kreative Transformationen: Aus Fotos lassen sich etwa Wackelkopf-Figuren, Weihnachtsschmuck oder Retro-Werbeanzeigen erstellen
  • Genaueres Befolgen von Anweisungen: Das neue Modell hält sich genauer an die Vorgaben
  • Bessere Textdarstellung: Auch lange Texte werden fehlerfrei und in verschiedenen Schriftarten dargestellt

Dazu kommen weitere Qualitäts-Verbesserungen, etwa bei der Darstellung von vielen Gesichtern auf einem einzelnen Bild oder Lichtspiegelungen auf unterschiedlichen Oberflächen.

OpenAI selbst spricht von einem echten Fortschritt im Vergleich zum vorherigen Modell, räumt aber auch ein, dass es weiteren Raum zur Verbesserung gibt. Manche Sprachen können etwa schlechter dargestellt werden als andere, und bei Grafiken schleichen sich auch weiterhin faktische Fehler ein.

zu den Kommentaren (1)

Kommentare(1)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.