Mit GPT-5 hat OpenAI eines der wohl größten Updates seit der Einführung von ChatGPT veröffentlicht. Die neue KI-Generation verspricht nicht nur mehr Intelligenz, sondern auch weniger Halluzinationen und Fehler, schnellere Antworten sowie deutlich bessere Ergebnisse in Programmierung, Schreiben und Gesundheitsfragen.
Während GPT-4 in vielen Bereichen noch auf mehrere Modellvarianten setzte, vereint GPT-5 alles unter einer Haube – inklusive einer Thinking-Funktion für komplexere Aufgaben. Für Plus-Nutzer gilt das übrigens nicht mehr.
Ich habe das neuste Modell gegen seinen Vorgänger antreten lassen und an fünf Prompts getestet. Dabei schauen wir uns an, wie sich die KI im Alltag schlägt und wo sich die Unterschiede besonders bemerkbar machen.
Was kann ChatGPT 5?
Laut OpenAI soll ChatGPT-5 im Vergleich zu ChatGPT-4 deutlich weniger sachliche Fehler bergen und auch deutlich weniger Halluzinationen einbringen. Besonders in Programmierung, kreativem Schreiben und Gesundheitsfragen soll es präzisere und hilfreichere Ergebnisse geben beziehungsweise bessere Rückfragen stellen, um euch bessere Hinweise zu geben.
Es verarbeitet komplexe Aufgaben angeblich schneller und mit höherer Genauigkeit, vor allem dank der neuen Thinking-Funktion, die bei Bedarf tiefergehendes Reasoning ermöglicht. Außerdem vereint GPT-5 verschiedene Modellvarianten unter einer Haube, sodass ihr nicht mehr händisch das beste Modell wählen müsst.
Besonders eindrucksvoll dürfte die Coding- und Design-Power sein. OpenAI zeigt, wie aus einem Prompt ein Minispiel oder ein eigenes Tool wird. Selbst detailreiche 3D-Szenen entstehen aus einem einzigen, prägnanten Prompt, ohne dass tiefes Programmierwissen nötig ist.
Beachtet, dass die Nutzung des neuen Modells derzeit nur mit einer Anmeldung beziehungsweise nur mit einem gültigen Account möglich ist.
Test 1: Minispiel erstellen
In seiner Presseankündigung zeigt OpenAI, wie sich mit wenigen Anweisungen ein kleines Minispiel erstellen lässt – ganz im Stil der guten alten Browser-Game-Zeiten. Sogar den vollständigen Prompt teilt das Unternehmen, um den Anwendungsfall möglichst transparent zu machen. Das Ergebnis seht ihr hier:
Das ist der Prompt von OpenAI:
Erstelle eine Single-Page-App in einer einzigen HTML-Datei mit den folgenden Anforderungen:
- Name: Jumping Platform Runner
- Ziel: Über Hindernisse springen, um so lange wie möglich zu überleben.
- Funktionen: Steigende Geschwindigkeit, Anzeige der Höchstpunktzahl, Neustart-Button
- Design: Farbige Benutzeroberfläche mit Parallax-Scrolling-Hintergründen
- Spielniveau: Soll allen Spaß machen
Tatsächlich liefert mir ChatGPT-5 nach dem Kopieren des Prompts bereits nach 12 Sekunden ein funktionierendes Ergebnis. Spielerisch zwar noch nicht ganz ausgereift, könnte ich hier aber direkt Anpassungen vornehmen – und mit Programmierkenntnissen sogar noch umfassendere Änderungen umsetzen.
In ChatGPT-4 erhalte ich ebenfalls einen HTML-Code, den ich jedoch nicht direkt im Chat ausführen kann. Stattdessen muss ich ihn zunächst kopieren und eigenständig in einer passenden Umgebung testen.
Nach dem Kopieren des Codes in das entsprechende Format kann ich auch hier spielen, allerdings seht ihr im Vergleich, dass die GPT-4-Darstellung viel geringer ausfällt.
Test 2: Mehrstufiges logisches Denken
ChatGPT hatte bei Rätseln in der Vergangenheit häufig Schwierigkeiten, da viele Zwischenschritte im Gedächtnis behalten und teils komplexe logische Bedingungen berücksichtigt werden müssen.
Hier teste ich mit folgendem Prompt, ob GPT-5 wirklich besser logisch denken kann:
Vier Freunde – Anna (A), Ben (B), Carla (C), David (D) – sitzen an einem runden Tisch.
Wir haben folgende Hinweise:
- Anna sitzt nicht neben Ben.
- Carla sitzt genau zwischen Ben und David.
- David sitzt links von Anna.
- Zwischen Anna und Carla sitzt genau eine Person.
Ziel: Finde die Sitzordnung im Uhrzeigersinn, beginnend mit Anna.
Tatsächlich kommt ChatGPT 4 bei den ersten beiden Versuchen - selbst nach meinem Hinweis - nicht auf die richtige Lösung – beide Male werden die logischen Bedingungen ignoriert.
ChatGPT 5 hingegen benötigt für die Lösung etwas mehr Zeit, liefert dann aber eine korrekte Antwort. Es scheint also in der Lage zu sein, die Bedingungen präziser in das Ergebnis einzubinden.
Für mich ist das ein klarer Beweis, dass GPT-5 nicht nur besser denkt
, sondern auch konsequenter auf alle Bedingungen achtet. Wer komplexe Probleme löst, wird den Unterschied deutlich merken.
Test 3: Fakten und Kontextverknüpfung
Bei Prompts, die Fakten mit Kontext verknüpfen, soll GPT-5 nun deutlich präziser handeln und bessere Ergebnisse liefern. Das alte Modell neige vor allem dazu, Verbindungen oft zu kurz oder oberflächlich zu gestalten. Hier ist mein Test-Prompt:
Fasse in 200 Wörtern zusammen, wie Quantencomputer funktionieren, und erkläre anschließend, wie sie konkret die Entwicklung von Medikamenten beschleunigen könnten. Nutze dabei eine Analogie, die für 12-Jährige verständlich ist.
In diesem Fall liefern beide Modelle klare Ergebnisse, die auch klar strukturiert werden. Da ich im Prompt nicht nach Quellen gefragt habe, habe ich in einer Nachfrage nochmal darauf bestanden und ebenfalls in beiden Fällen prüfbare Verweise bekommen. Zwar unterscheidet sich die Darstellung, doch die feinen Nuancen werden sich vermutlich am besten in einzelnen Fachgebieten und nach persönlichen Vorlieben zeigen.
Mir fällt vor allem auf, dass GPT-5 auf auf eine starke Struktur verzichtet und mir nur Absätze gibt, während GPT-4 mit Trennlinien arbeitet. Am Ende nutzt nur GPT-5 die Analogie, die ich wollte. GPT-4 nutzt diese von Beginn an und zieht sie durch das gesamte Ergebnis.
Test 4: Kreative Problemlösung
Gerade für erste kreative Ideen oder Brainstorming kann ChatGPT ein nützliches Tool sein. Gibt man der KI kreative Aufgaben, liefern sowohl das alte Modell als auch das Upgrade fundierte Ergebnisse.
Für den Test habe ich folgenden Prompt verwendet:
Erfinde ein neues Brettspiel, das in einer Welt spielt, in der Menschen nur noch über Emojis kommunizieren. Beschreibe die Spielmechanik, die Zielgruppe und wie es zu einem Hype werden könnte.
Beide Modelle geben die Antworten in klarer Struktur und in der von mir vorgegebenen Reihenfolge. Eine interessante Feinheit: Das neue Modell scheint meinen Auftrag genauer verstanden zu haben. Während GPT-5 die Frage Wie wird es zum Hype?
direkt beantwortet, erklärt GPT-4, warum es zum Hype werden wird. Das eine ist also eine konkrete Handlungsanleitung, das andere eine Begründung.
Im direkten Vergleich scheint GPT-5 auch hier wieder mein Anliegen besser zu verstehen und entsprechend umzusetzen. GPT-4 scheint sich die Antworten noch stärker hinzubiegen.
Test 5: Sprachgefühl & Stilflexibilität
Das Urgestein unter den Fähigkeiten von ChatGPT ist sicherlich die Textausgabe – und vermutlich auch heute noch eines der meistgenutzten Features des Tools. GPT-5 soll hier nuancierter und natürlicher wirken als seine Vorgänger. Der Prompt für den Vergleich lautet:
Schreibe einen 150-Wörter langen Text über den Geruch von frisch gebackenem Brot im Stil eines 19-jährigen TikTok-Creators und danach denselben Text im Stil eines 80-jährigen Schriftstellers. Beide Versionen sollen denselben Fakt enthalten: dass der Geruch Erinnerungen an die Kindheit weckt.
Die Unterschiede sind subtil und hängen stark von der persönlichen Vorliebe ab. Mir fällt aber auf, dass GPT-5 flüssiger und klarer formuliert, die Rollen etwas präziser umsetzt und keine Absätze einfügt, was den Lesefluss verbessert.
GPT-4 wirkt dagegen leicht kantiger, aber auch klar getrennt in den beiden Stilwelten. Für mich fühlt sich GPT-5 hier moderner und natürlicher an, auch wenn der Vorsprung in diesem Beispiel nicht riesig ist.
Fazit und Ausblick
Bei der rasanten Entwicklung der KI-Anbieter lohnt sich immer ein Vergleich der aktuellen Modelle. Meine Kollegin Ursula hat GPT-5 schon mit Modellen anderer Unternehmen verglichen.
Im direkten Vergleich der GPTs von OpenAI fällt mir auf, dass ChatGPT-5 in vielen Bereichen einen klaren Sprung nach vorne macht. Besonders bei komplexen, mehrstufigen Aufgaben wie logischen Rätseln oder Programmierprojekten erlebe ich es als präziser und praktischer einsetzbar als GPT-4.
Bei kreativen oder stilistischen Aufträgen sind die Unterschiede für mich subtiler, aber GPT-5 wirkt hier insgesamt flüssiger, fokussierter und oft einfach „runder“. Die Mischung aus schnellerer Verarbeitung, weniger Fehlern und der komfortablen Bündelung aller Modellvarianten empfinde ich als echten Alltagserleichterer.
Wer wie ich regelmäßig mit KI arbeitet und auch anspruchsvollere Projekte umsetzt, wird diese Verbesserungen deutlich spüren. Für Gelegenheitsnutzer bleibt GPT-4 im Gratismodus allerdings nach wie vor eine solide Wahl.
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.