ChatGPT macht jetzt noch bessere Bilder: Mit der Einführung von GPT-4o hat die Bildergenerierung mit der KI ein neues Level erreicht.
Das hat uns zuerst den Ghibli-Trend gebracht und nun nutzen viele ChatGPT, um sich selbst zu Actionfigur zu machen.
Das neue Modell GPT-4o bringt nämlich ganz konkrete Vorteile, die ihr für richtig gute Bilder nutzen könnt. Dafür braucht ihr nur die 6 folgenden Tipps für bessere Prompts zu beachten.
44:19
»Künstliche Intelligenz ist die neue Elektrizität« - Wir busten mit einem Experten 5 Mythen zu KI
1. Verwendet ChatGPT selbst für eure Prompts
KI-Chatbots können alle möglichen Texte generieren, warum nicht also auch Prompts? Das ist tatsächlich wahr, aber gerade für das neue Modell GPT 4o stimmt das ganz besonders. Das ist laut OpenAI nämlich omnimodal
.
Omnimodal heißt hier: Texte und Bilder werden nicht nur gemeinsam verstanden
, sondern auch vom gleichen neuronalen Netz verarbeitet und erzeugt. So kann das Modell Sprache und visuelle Darstellungen auf hohem Niveau miteinander verknüpfen.
Wenn ihr also eine vage Idee habt, wie euer Bild aussehen soll, kann ChatGPT euch helfen, das in einen visuell starken Prompt zu übersetzen. Den könnt ihr dann noch weiter anpassen.
Ein Pluspunkt hierbei: In der Gratis-Version habt ihr eine Maximalanzahl an Generierungen. Wenn ihr gleich mit einem treffsicheren Prompt startet, spart euch das Nachbessern.
2. Schreibt eure Prompts auf Englisch
ChatGPT funktioniert in vielen Sprachen sehr gut. Aber die Daten, auf denen die GPT-Modelle trainiert wurden, sind vornehmlich Englisch. Es gibt zwar keine offizielle Liste, welche Daten die Firma zum Training seiner Modelle verwendet.
In ihrem Paper geben die Entwickler von GPT-4o allerdings beispielsweise Shutterstock, einen Anbieter von Stock-Fotos, als eine Quelle an. OpenAI verwendet zum Training aber nicht nur die Stock-Fotos, sondern auch deren Captions, also die Bildbeschreibungen.
Und auch auf Shutterstock – ähnlich auch wie auf Instagram etwa – wird vornehmlich auf Englisch gearbeitet. Gerade wenn ihr also eine sehr detaillierte Vorstellung davon habt, was auf eurem Bild zu sehen sein soll, dann kann es sich lohnen, den Prompt final auf Englisch zu übersetzen.
Euer Englisch ist nicht so gut? Kombiniert doch einfach Tipp 1 und 2: Wenn ihr einen Prompt mit ChatGPT generieret, dann lasst ihn euch doch gleich auf Englisch ausgeben.
3. Beschreibt Inhalt und Stil
Das ist ein ganz genereller Tipp für die Text-zu-Bild-Generierung: Folgt in der Beschreibung der Bilder immer der Grundform:
- Inhalt + Stil
- Das bedeutet: Ihr beschreibt: Was ist auf dem Bild? Und: Wie ist es dargestellt?
Der Trend rund um Studio Ghibli basiert etwa darauf, dass Nutzer hier mit dem Schlagwort Ghibli
sofort einen wiedererkennbaren Stil bekommen. Denkt hierfür etwa an Künstler, Materialien oder Foto- und Malstile.
Statt: Ein Bild von einem Vogel
schreibt ihr besser:
Ein Bild von einem Vogel im Stil von Dalí.
oder
Ein fotorealistisches Bild von einem Vogel.
Vielleicht merkt ihr selbst, dass mit Stilbeschreibungen auch im eigenen Kopf sofort ein klareres Bild entsteht.
4. Denkt wie ein Fotograf
Wie oben erwähnt wurde GPT-4o unter anderem mit Bildern aus Stock-Foto-Datenbanken und deren Metadaten trainiert. Die Captions, also Bildbeschreibungen, sind auf solchen Plattformen in der Regel von Fotografen selbst eingestellt und enthalten entsprechend auch Begriffe aus diesem Bereich.
Stellt euch also vor, ihr wärt selbst der Fotograf: Aus welcher Perspektive nehmt ihr das Bild auf? Wie ist das Bild komponiert? Wo sitzt der Fokus?
Ein Beispielprompt mit vielen solcher Begriffe wäre etwa:
Nahaufnahme einer blauen Blume mit Wassertropfen, aufgenommen mit geringer Tiefenschärfe. Der Fokus liegt auf der Blüte, der Hintergrund ist unscharf. Das Bild wurde aus einem leicht erhöhten Winkel aufgenommen, mit einem horizontalen Kamerawinkel. Weiches, natürliches Licht beleuchtet die Blume.
5. Was fühlt ihr, wenn ihr das Bild anschaut?
Genauso wichtig für einen guten Prompt ist aber auch die Perspektive des Betrachters. Nutzt bei der Verwendung von ChatGPT zum Bildergenerieren emotionale Begriffe, um die Atmosphäre zu beschreiben.
Vermittelt euer Bild eine traurige oder fröhliche Atmosphäre? Bei ChatGPT kann ein Haus ruhig einsam, melancholisch oder auch verspielt sein. All solche Begriffe beeinflussen die Farben, Lichtstimmungen und Kompositionen im Bild.
Statt: Eine kleine Hütte in den Bergen umgeben von Bäumen bei Sonnenuntergang.
Schreibt doch lieber:
Eine einsame Hütte in nebligen Bergen bei Sonnenuntergang, gemalt in düsteren, entsättigten Farbtönen, mit weichem Licht und einer ruhigen, melancholischen Stimmung.
6. Führt einen Dialog
All die vorangegangenen Tipps könnt ihr auch nachträglich einbeziehen: ChatGPT bekommt seine Informationen aus dem gesamten Dialog, den ihr führt. Das derzeitige Modell 4o hat laut OpenAI ein Kontextfenster von 128.000 Token, das heißt: Erst wenn euer Gespräch über 96.000 Wörter lang wird, könnt ihr euch sicher sein, dass ChatGPT die vorherigen Informationen vergessen
hat.
Deswegen: Wenn ihr ein Bild generiert habt, das ihr mögt, aber das in bestimmten Details nicht passt, dann schreibt:
Wie sieht das gleiche Bild bei Sonnenaufgang aus?
oder:
Mach die Stimmung fröhlicher.
GPT-4o kann Bild-Generierungen im Gesprächsverlauf kontextuell variieren, ohne dass ihr jedes Mal bei 0 anfangen müsst. Aber bedenkt: In der Gratis-Version ist nach wenigen Generierungen Schluss und euer Limit wird erst Stunden später zurückgesetzt.
Schreibt eure Prompts also immer mit Bedacht. Mit den vorangegangenen Tipps sollte das allerdings auch kein Problem sein.
Und wer weiß – vielleicht setzt ja ihr sogar den nächsten Trend.
Was denkt ihr darüber? Habt ihr noch mehr Tipps, wie Bilder mit ChatGPT noch besser werden? Und benutzt ihr die Bilder-KI aktiv für berufliche oder private Angelegenheiten? Schreibt uns eure Tipps und Erfahrungen in die Kommentare!
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.