OpenAI hat soeben das neue ChatGPT Images gestartet – mit einem ganz klaren Ziel: Es mit Googles Phänomen Nano Banana Pro aufzunehmen

Mit dem neuen Bildmodell lassen sich verschiedene Transformationen generieren. (Bild: OpenAI)

OpenAI war im großen KI-Rennen zuletzt etwas hinter Google zurückgefallen und versucht jetzt, die Lücke zu schließen. Nach dem vorgezogenen Release von GPT-5.2 wurde jetzt mit ChatGPT Images auch ein verbessertes Modell zur Bilderstellung veröffentlicht.

Auf den Spuren von Nano Banana Pro

Google hat zuletzt vermehrt für Aufsehen gesorgt. Das neue KI-Modell Gemini 3 Pro lässt die Konkurrenz alt aussehen und der KI-Bildgenerator Nano Banana Pro war nach dem Launch so beliebt, dass Google den Zugriff einschränken musste.

0:55 ChatGPT Images: OpenAI stellt neues KI-Modell zur Bildbearbeitung vor

Autoplay

Dazu kamen Berichte, dass ChatGPT im Vergleich zu Gemini schon seit geraumer Zeit deutlich langsamer wächst, was sicherlich auch an der sowieso schon komfortablen Markt-Situation zusammenhängt. Das alles soll dazu geführt haben, dass bei OpenAI intern der »Code Red« ausgerufen wurde.

In der Folge soll sich der Fokus wieder stärker auf die Weiterentwicklung der KI-Modelle verschoben haben. Das erste Ergebnis davon war GPT-5.2, das nur einen Monat nach GPT-5.1 veröffentlicht wurde. Das Zweite sind nun ChatGPT Images und das neue Bildmodell.

Bei Images handelt es sich letztlich »nur« um eine dedizierte Umgebung für das Erstellen von Bildern. In der App und auf der Webseite ist jetzt bei den Chats auch der Menüpunkt »Bilder« zu finden. Dort werden auch schon ein paar Möglichkeiten vorgestellt.

Deutlich spannender sind vermutlich die Verbesserungen, die OpenAI dem KI-Bildgenerator verpasst haben will. Diese erinnern nicht zufällig an die Neuerungen, die Nano Banana Pro geboten hat:

Präzise Edits auch über mehrere Bilder hinweg: Bilder können umfangreich angepasst, verbessert und verändert werden
Kreative Transformationen: Aus Fotos lassen sich etwa Wackelkopf-Figuren, Weihnachtsschmuck oder Retro-Werbeanzeigen erstellen
Genaueres Befolgen von Anweisungen: Das neue Modell hält sich genauer an die Vorgaben
Bessere Textdarstellung: Auch lange Texte werden fehlerfrei und in verschiedenen Schriftarten dargestellt

Derzeit beliebt bei GS Tech

Das habe ich in meinem gesamten Berufsleben noch nicht gesehen: Spieler verzweifelt, weil er das LAN-Kabel nicht mehr aus seinem Notebook bekommt [Best of GameStar]

von Sven Scharpe

Lidl verkauft ab morgen ein faltbares E-Bike von einem deutschen Hersteller – für wen lohnt sich der Kauf?

von Marinus Martin

Nach über 10 Jahren Android, bin ich jetzt zu einem iPhone gewechselt: Mein Fazit nach drei Monaten [Best of GameStar]

von Duy Linh Dinh

Dazu kommen weitere Qualitäts-Verbesserungen, etwa bei der Darstellung von vielen Gesichtern auf einem einzelnen Bild oder Lichtspiegelungen auf unterschiedlichen Oberflächen.

OpenAI selbst spricht von einem echten Fortschritt im Vergleich zum vorherigen Modell, räumt aber auch ein, dass es weiteren Raum zur Verbesserung gibt. Manche Sprachen können etwa schlechter dargestellt werden als andere, und bei Grafiken schleichen sich auch weiterhin faktische Fehler ein.