ChatGPT stellt die neue Version seines Bildgenerators auf Basis des 4o-Modells vor.

OpenAI integriert einen neuen Bildgenerator in ChatGPT, der auf Basis des 4o-Modells arbeitet. Damit wird auch das bisherige Dall-E-Modell innerhalb von ChatGPT abgelöst – das aber weiterhin als separate App zur Verfügung stehen soll.

Damit darf sich das omnimodale Modell 4o nun auch als nativer Bildgenerator verstehen, da nur noch dieses Modell für die Generierung von Bildern und Text zuständig ist.

Grundsätzlich verspricht OpenAI in der zugehörigen Vorstellung, die auch als Stream via YouTube abgehalten wurde, einen deutlichen Fortschritt in drei Aspekten:

Präzise Textintegration : Der neue Bildgenerator kann Texte deutlich genauer in Bilder einfügen.

: Der neue Bildgenerator kann Texte deutlich genauer in Bilder einfügen. Transparente Hintergründe : Nutzer können Bilder mit transparenten Hintergründen erstellen.

: Nutzer können Bilder mit transparenten Hintergründen erstellen. Verbesserte Kontextsensibilität: Das Modell versteht Anweisungen besser und kann Bilder basierend auf detaillierten Beschreibungen oder hochgeladenen Dateien generieren und modifizieren.

Als Beispiel für die neuen Möglichkeiten nennt OpenAI unter anderem den Fotoupload eines realen Wohnzimmers; darauf basierend sollen visualisierte Vorschläge für die Inneneinrichtung folgen. Zudem sollen komplexe Konzepte oder Diagramme deutlicher und schlicht ordentlicher aussehen.

Für die Transparenz im Kontext der KI-generierten Herkunft eines solchen Bildes sollen Metadaten zum Einsatz kommen.

Hierbei wird der offene Standard C2PA (Coalition for Content Provenance and Authenticity) verwendet, der auch von anderen Unternehmen wie Adobe oder Google zur Verifizierung von digitalen Inhalten eingesetzt wird.

ChatGPT-4o: Mehr Freiheiten bei der Bildgenerierung

OpenAI-CEO Sam Altman betonte zudem auf der X-Plattform, dass der neue Bildgenerator weniger strenge Einschränkungen bei der Erstellung von Inhalten aufweisen soll.

Nutzer sollen »mehr Freiheiten« erhalten, um ihre kreativen Ideen umzusetzen. Gleichzeitig erklärte Altman, dass OpenAI gesellschaftliches Feedback berücksichtigen werde, um sicherzustellen, dass diese Freiheit verantwortungsvoll genutzt wird.

Die neue Funktion wird schrittweise eingeführt und steht zunächst Nutzern mit Plus-, Pro-, Teams- und Free-Konten zur Verfügung. Enterprise- und Edu-Kunden sollen später Zugang erhalten.