Nano Banana Pro soll in drei Punkten besser sein: Ich habe Googles Bilder-KI gegen ChatGPT antreten lassen

Googles Bilder-KI Nano Banana Pro soll Bildgenerierung mit KI auf eine neue Stufe heben. Ich habe drei Versprechen von Google gegenüber ChatGPT getestet.

Googles Nano Banana Pro soll gegenüber anderen Modellen einige Vorteile haben: Ich habe es gegenüber ChatGPT getestet. Googles Nano Banana Pro soll gegenüber anderen Modellen einige Vorteile haben: Ich habe es gegenüber ChatGPT getestet.

Nano Banana Pro sorgt für Aufsehen: Vermeintliche Bilder vom Set des neuen Avengers-Films, die mithilfe von Google Nano Banana Pro gemacht wurden, zeigen wie schwer es mittlerweile ist, KI-Fakes von echten Bildern zu unterscheiden.

Wie so häufig, wenn ein neues Modell auf den Markt kommt, spart auch Google in seiner Ankündigung von Nano Banana Pro nicht mit Superlativen: Es sei in bestimmter Hinsicht das beste Modell, biete eine enorme Menge an Assets in einem noch nie dagewesenen Umfang.

Der Silicon-Valley-Konzern betont drei Eigenschaften seiner neuen Bilder-KI besonders:

  1. Bessere Texte im Bild
  2. Höhere Konsistenz in den Bildern
  3. Mehr und genaueren Kontext in den Bildern

Ich habe für diese Behauptungen jeweils einen Prompt erstellt und Googles Bilder-KI gegen DALLE 3, auf dessen Grundlage auch Nutzer von ChatGPT derzeit Bilder direkt im Chat erstellen können, miteinander verglichen.

Und ich muss sagen: Google erfindet hier nicht das Rad neu, aber macht besonders in einem Aspekt einen interessanten Sprung.

Video starten 44:19 »Künstliche Intelligenz ist die neue Elektrizität« - Wir busten mit einem Experten 5 Mythen zu KI

1. Bessere Texte im Bild

Schrift im Bild war lange das Kryptonit von KI-Bildergeneratoren. Buchstaben, die eher nach Aliensprache denn echter Schrift aussahen, waren lange ein deutliches Anzeichen, dass ein Bild mithilfe von KI erstellt wurde.

Einen großen Sprung in diesem Bereich machte im Frühling dieses Jahres der verbesserte Bildgenerator im ChatGPT-Modell 4o. Plötzlich sah ein Schriftzug im Bild nach echter Sprache aus. Prompt folgte der Actionfigur-Trend, in dem sich Nutzer selbst als Plastikfigur in einer beschrifteten Verpackung darstellten.

Nano Banana Pro will die Generierung von Text im Bild nun noch einmal verbessern und wirbt mit perfekten Texten in mehreren Sprachen.

Um das zu testen, habe einen Prompt geschrieben, in dem das jeweilige Modell aufgefordert wird, ein Plakat mit Text in unterschiedlichen Schriftarten einmal in lateinischen und einmal in kyrillischen Buchstaben auszugeben.

Der Prompt: Ein futuristisches Plakat

Generiere ein ultradetailliertes Werbeplakat im futuristischen Retro-Stil, das einen Roboter-Dienst bewirbt. Der Hauptslogan 'MENSCHENMASCHINE' muss in einer geschwungenen, kalligrafischen, roten Neon-Schrift in der oberen Hälfte erscheinen. Darunter muss in einer klaren, serifenlosen, weißen Druckschrift der russische Unterslogan in kyrillischen Buchstaben 'ICH BIN DEIN DIENER. ICH BIN DEIN ARBEITER.' aus dem Song "Roboter" von Kraftwerk stehen. Die Gesamtästhetik muss 'Vaporwave' sein. 4K-Auflösung.

Nano Banana Pro ChatGPT Nano Banana Pro ChatGPT

Grundsätzlich lässt sich festhalten: Beide Modelle stellen sowohl den lateinischen, als auch den kyrillischen Text korrekt dar. Wo ChatGPT allerdings hinter Nano Banana zurückbleibt, ist die Übersetzungsleistung:

  • Gebe ich beiden Modellen den gewünschten kyrillischen Text: Я ТВОЙ СЛУГА. Я ТВОЙ РАБОТНИК im Prompt mit dazu, geben sie ihn beide korrekt wieder.
  • Im obigen Prompt habe ich den gewünschten Text allerdings nur umschrieben: Ich habe die deutsche Übersetzung Ich bin dein Diener, ich bin dein Arbeiter und eine Referenz zum Lied Roboter der Band Kraftwerk vorgegeben, in dem der Text vorkommt.
  • Hier macht ChatGPT mit »ТВОЯ« einen grammatikalischen Fehler und auch das Wort РАБОЧИЙ ist zwar eine mögliche Übersetzung von Arbeiter – allerdings nicht wie im vorgegebenen Song.

Hier zeigt sich ein interessanter Aspekt von Nano Banana auf, den wir uns im dritten Punkt genauer ansehen: Ein besseres Verständnis von Kontext-Informationen.

2. Höhere Konsistenz

Google verspricht mit Nano Banana Pro eine höhere Konsistenz in Bildern. Das bedeutet: Gebt ihr ein Bild oder eine Beschreibung eines Charakters in die Bilder-KI ein, soll der über mehrere Bilder konsistent in seinem Aussehen bleiben.

Mein erster Gedanke: Wie wäre es mit einem Comic? Hierzu erstelle ich in einem separaten Chat mit Nano Banana Pro ein Referenzbild.

Für meinen Comic-Strip erstelle ich mir mithilfe von Nano Banana Pro einen Detektiv-Charakter (KI-generiert mit Nano Banana Pro) Für meinen Comic-Strip erstelle ich mir mithilfe von Nano Banana Pro einen Detektiv-Charakter (KI-generiert mit Nano Banana Pro)

Der oben dargestellte Charakter tritt nun in einem Comic auf, der einen deutlichen Stilwechsel vom zweiten zum dritten Bild enthält. Dieses Mal erstelle ich mithilfe von Claude Sonnet 4.5 einen Prompt auf Englisch.

Der Prompt: Ein Comic

A wide, cinematic comic strip layout consisting of three horizontally arranged panels. The main character in all panels is the exact man depicted in the provided reference image. His facial features and clothing (trench coat, hat, tie) must remain visually consistent with the reference image across the changing styles.

**PANEL 1 (Left)**

**Style:** Dim, atmospheric film noir comic book art featuring heavy ink shadows and extreme high contrast.

**Description:** The detective from the reference image stands in deep darkness. A mysterious dark-skinned woman emerges from the shadows, her hand featuring a prominent, ornate ring as she hands him a small, intensely glowing golden vial. A speech bubble above says: "Trink, dann wird alles besser."

**PANEL 2 (Middle)**

**Style:** Dramatic comic book close-up panel with intense, high-contrast lighting.

**Description:** A tight close-up on the face of the detective from the reference image. His eyes are squeezed tightly shut in concentration as he drinks the golden liquid. The supernatural glow from the vial underlights his face drastically, casting deep shadows upwards.

**PANEL 3 (Right)**

**Style:** RADICAL SHIFT to 80s film photography. The entire image is rendered in grainy, harsh, photorealistic sunlight with vivid colors.

**Description:** A crowded, bustling Miami Beach in the 1980s filled with sunburned tourists. The detective from the reference image stands dead center, eyes wide open in total shock, sweating profusely in his heavy clothes amidst the beach crowd. Evidently dropped in shock moments before, the small golden vial lies on the hot sand at his feet, liquid spilling out.

Ergebnis mit Nano Banana Pro:

Nano Banana Pro hat auf Grundlage des Prompts einen dreiteiligen Comic generiert. Nano Banana Pro hat auf Grundlage des Prompts einen dreiteiligen Comic generiert.

Ergebnis mit ChatGPT:

ChatGPT hat auf Grundlage des Prompts einen dreiteiligen Comic generiert. ChatGPT hat auf Grundlage des Prompts einen dreiteiligen Comic generiert.

Hier hat Nano Banana eindeutig die Nase vorn, besonders wenn man die Konsistenz betrachtet:

  • Der vorgegebene Detektiv hat eine Narbe auf der Wange, die im Prompt auch noch einmal erwähnt wird. Nano Banana gibt die konsistent wieder, ChatGPT nicht.
  • Allerdings, auch das Nano Banana-Ergebnis ist nicht perfekt: Das Fläschchen im letzten Bild ist im Vergleich zu groß, auch die austretende Flüssigkeit passt nicht in den Stil des Bildes.
  • Was bei mehreren Anläufen mit ChatGPT ebenso auffällt: Der Bilder-Generator schafft es nicht den vorgegebenen Detektiv als ganze Figur darzustellen, zu deren Füßen dann das Fläschchen mit der goldenen Flüssigkeit liegt.

3. Mehr und genauerer Kontext

Google erklärt, dass ihr mit Nano Banana Pro Wissen aus der realen Welt besser visualisieren könnt. Denn Nano Banana Pro könne auf die umfangreiche Wissensbasis der Google Suche zurückgreifen und so sogar Echtzeitinformationen mit in die Bilder aufnehmen.

Das ist eine Eigenschaft, die ich mit einem kurzen, möglichst freien Prompt teste:

Prompt: Aktuelle Daten aus Rio De Janeiro

Erstelle eine Vintage Postkarten-Infografik für Rio De Janeiro. Die Infografik soll folgende Informationen enthalten: das aktuelle Wetter für 4 Tage (Donnerstag 4. Dezember bis Sonntag 7. Dezember 2025) mit jeweiliger Höchst- und Tiefsttemperatur pro Tag, sowie dazu passende Tagesausflugsziele in und um Rio für jeden dieser Tage. Gestalte alles im Retro-Reiseposter-Stil mit leuchtenden tropischen Farben und übersichtlichem Layout.

Ergebnis mit Nano Banana Pro:

Nano Banana Pro generiert mir aus meinem Prompt eine hübsche Infografik mit relativ akkuraten Wetterdaten. (KI-generiert mit Nano Banana Pro) Nano Banana Pro generiert mir aus meinem Prompt eine hübsche Infografik mit relativ akkuraten Wetterdaten. (KI-generiert mit Nano Banana Pro)

Ergebnis mit ChatGPT:

ChatGPT liefert korrekte Informationen, allerdings kann es die nicht in einem Bild wiedergeben. (KI-generiert mit ChatGPT) ChatGPT liefert korrekte Informationen, allerdings kann es die nicht in einem Bild wiedergeben. (KI-generiert mit ChatGPT)

An dieser Stelle zeigt sich eine besondere Fähigkeit der Informationsverarbeitung von Nano Banana Pro, die ChatGPT bisher fehlt:

  • Die von Nano Banana dargestellten Temperaturen decken sich im Großen und Ganzen mit der aktuellen Wettervorhersage für Rio De Janeiro, die ich über eine Google-Suche finde. Das Bild entspricht der Vorgabe und ist visuell ansprechend.
  • ChatGPT hingegen kann die Aufgabe auch bei mehreren Wiederholungen nur in zwei Schritten ausführen: Zuerst generiert der Chatbot Bilder im Postkartenstil, dann erst folgen die Wetterdaten separat.

Fazit: Nano Banana Pro überzeugt mit einer Eigenschaft besonders

Grundsätzlich zeigen sowohl Nano Banana Pro als auch ChatGPT starke Kompetenzen im Bereich der Bildgenerierung. Mit ein bisschen Feilen am Prompt ist bei beiden Modellen sicherlich auch noch mehr Verbesserungspotenzial.

Die versprochenen besseren Eigenschaften von Nano Banana Pro sind keine absoluten Neuheiten – auch bei ChatGPT hatte ich keine größeren Probleme mit der Darstellung von Text im Bild.

Allerdings: Nano Banana Pro zeigt aus meiner Perspektive eine besondere Stärke und das ist der Kontext. Die letzte Aufgabe mag speziell wirken, aber die Fähigkeit Googles Weltwissen in Bilder zu übersetzen ist durchaus beeindruckend. Mich hat das besonders im ersten Punkt überzeugt:

Um den kyrillischen Text korrekt darzustellen, reichte bei Nano Banana Pro eine Umschreibung – die genügte dem Chatbot, um den gewünschten Text richtig auszugeben. Eine solche Verbindung ist stark und könnte in unterschiedlichen Anwendungen gesamt zu befriedigenderen Ergebnissen führen.

Allerdings: Der kostenlose Zugriff ist bei beiden Modellen aktuell stark eingeschränkt. Bei Nano Banana Pro bekommt ihr aufgrund der hohen Nachfrage ohne Bezahl-Zugang derzeit nur zwei Bilder pro Tag, bei ChatGPT war in meinem Versuch nach fünf Generierungen Schluss.

zu den Kommentaren (3)

Kommentare(3)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.