Alternative zu ChatGPT Plus: Ich habe Qwen eine Woche getestet und spare mir jetzt 23 Euro im Monat

Kann ein kostenloses LLM mit ChatGPT Plus mithalten? Ich habe Qwen getestet – und herausgefunden, ob ich mir die 23 Euro im Monat sparen kann.

ChatGPT bietet seit Längerem eine kostenpflichtige Plus-Version, die für 23 Euro bessere Sprachmodelle und zusätzliche Funktionen bietet, die die Nutzung erleichtern.

Doch die Konkurrenz schläft nicht: Neben DeepSeeks R1-Modell, das riesige Wellen in den Medien schlug, ging die Ankündigung eines weiteres vielversprechenden Large Language Model (LLM) aus China beinahe unter: Alibabas LLM Qwen.

Als treuer ChatGPT-Plus-Abonnent habe ich mich gefragt:

Ist es wirklich nötig, Geld für ChatGPT Plus auszugeben, oder bekomme ich mit der kostenlosen KI von Alibaba die gleichen Ergebnisse?

Meine Antwort darauf erfahrt ihr in diesem Artikel.

Video starten 40:10 ChatGPT am Ende? Das kann DeepSeek wirklich

Alles Wichtige zu Qwen im Schnellüberblick

Bevor wir eintauchen, hier noch ein schneller Abriss, was Qwen überhaupt ist.

Was ist Qwen? Qwen stammt von der Alibaba Group, einem multinationalen E-Commerce-Technologiekonzern mit über 200.000 Mitarbeitern.

Neu ist Qwen allerdings nicht: Die erste Version erschien bereits im April 2023 unter dem Namen Tongyi Qianwen. Qwen2 basiert auf dem LLM Llama von Meta AI und bietet sowohl textbasierte als auch multimodale Modelle mit Bildverarbeitung.

Besonders spannend: Qwen kann auch Videos erstellen, was mit ChatGPT Plus in Deutschland noch nicht möglich ist. Mehr dazu gleich.

Alibaba behauptet, dass Qwen2.5-Max mit etablierten Modellen wie GPT-3 und Gemini in der Textgenerierung, Codeerstellung und mathematischen Aufgaben mithalten kann.

Im September 2023 wurde Qwen öffentlich verfügbar gemacht. In den folgenden Monaten stellte Alibaba weitere Modelle als Open Source bereit:

  • August 2023: Qwen 7B wurde freigestellt
  • Dezember 2023: Qwen 72B und Qwen 1.8B erscheinen
  • Januar 2025: Qwen2.5-Max kommt heraus

Letztere ist die Version, die wir heute genauer unter die Lupe nehmen.

Video starten 4:28 Mein Handy hat jetzt ChatGPT integriert: So sieht das in der Praxis aus

So bin ich vorgegangen

Als selbsternannter KI-Heavy-User, der täglich mindestens 10–15 Mal die Plus-Version von ChatGPT nutzt, war mein Vorgehen naheliegend:

  • Alles, was ich in ChatGPT eingebe, teste ich parallel in Qwen.
  • Dieses Vorgehen habe ich über einen Zeitraum von sieben Tagen durchgeführt.
  • Wichtig zu erwähnen: Es handelt sich hierbei nicht um einen wissenschaftlichen Benchmark, sondern um einen Real-World-Test.

Qwen vs. ChatGPT Plus: User Interface & Funktionen

Beginnen wir mit der Oberfläche von Qwen. Wie seine Mitbewerber ist auch Qwen über ein Web-Interface nutzbar. Nutzer von ChatGPT und Konsorten werden sich hier rasch zurechtfinden.

Alle Links zu den Konversationen finden wir links, während im rechten Hauptteil der Anwendung der Chat angezeigt wird.

Ihr könnt Chats umbenennen, anpinnen und sortieren sowie Dateien wie Bilder hochladen. Außerdem könnt ihr das Sprachmodell wechseln sowie temporäre Chats starten. So weit, so gewöhnlich.

Darüber hinaus bietet Qwen folgendes Features, die auch ChatGPT (Plus) bietet:

  • Reasoning
  • Analyse von Dateien
  • Zugriff auf Internetsuche
  • Bilderstellung

Bemerkenswert: Bei der Bildgenerierung scheint Qwen kein Limit zu haben. Ich habe innerhalb von drei Stunden über 40 Bilder generiert. Bei ChatGPT ist nach drei Bildern Schluss – mehr gibt's nur im Plus-Abos.

Die Web-Oberfläche von ChatGPT Plus Die Web-Oberfläche von Qwen Die Web-Oberfläche von ChatGPT Plus Die Web-Oberfläche von Qwen

Allgemeine Tests: So gut ist Qwen im Alltag

Bevor ich überhaupt auf meine spezifischen Probleme eingegangen bin, habe ich als Erstes verschiedene allgemeinere Aufgaben an Qwen und ChatGPT gestellt:

  • Rechtschreibprüfung in Deutsch sowie Englisch
  • Wie finden Bienen Honig?
  • Wie kann ich in LaTeX eine Zahl hochstellen?
  • Binärsuche in JavaScript
  • Die Unentscheidbarkeit des Halteproblems
  • Die Anwendung des Kirchhoffschen Gesetzes bei einer gegebenen Aufgabe
  • Den Leverage-Effekt bei einer gegebenen Immobilie berechnen
  • Qualitative Inhaltsanalyse nach Mayring

Bei all diesen Aufgaben konnte ich keine signifikanten Unterschiede zwischen den Modellen erkennen.

Das liegt vermutlich daran, dass diese Probleme bereits umfassend gelöst wurden und LLMs oft aus denselben Informationsquellen trainiert werden.

Code-Generierung mit KI: Qwen überrascht

Viel interessanter wird es, wenn wir uns die Code-Generierung ansehen. Dazu habe ich folgendes einfaches Beispiel getestet: Erstelle einen CSS Code für eine Kalenderoberfläche.

Die Kalender-Visualisierungen der Modelle im Vergleich. Die Kalender-Visualisierungen der Modelle im Vergleich.


Wir können diesen Test beliebig oft wiederholen, auch mit etwas komplexeren Aufgaben, etwa einer Animation einer flackernden Flamme auf einer Kerze:

Die Kerzen-Visualisierungen der Modelle im Vergleich. Die Kerzen-Visualisierungen der Modelle im Vergleich.

  • In den gezeigten Beispielen bin ich der Meinung, dass Qwen insgesamt optisch ansprechendere Ergebnisse geliefert hat.
  • Man muss jedoch anmerken, dass es bei Coding-Prompts immer wieder Fälle gibt, in denen ChatGPT ein Stückchen besser ist, während bei anderen Aufgaben Qwen die besseren Ergebnisse liefert.
  • Insgesamt kann man jedoch sagen, dass beide Modelle ähnliche Ergebnisse liefern. Bei generischen und einfacheren Programmieraufgaben konnte ich keine signifikanten Unterschiede feststellen.

Wollen wir über die Grenzen einfacher Designs oder Animationen hinaus komplexere Zusammenhänge erstellen, stoßen beide Modelle an ihre Grenzen.

Bei Qwen kann man hier auf die sogenannte Artifact-Funktion zurückgreifen, mit der sich zumindest durch geschicktes Prompten mehr erreichen lässt. Artifact ist in etwa mit der Canva-Funktion von ChatGPT vergleichbar – eine Leinwand, auf der ihr den Output in Echtzeit seht und direkt anpassen könnt.

Diese hat zudem den netten Nebeneffekt, im Falle von Websprachen wie HTML, CSS und JavaScript in Echtzeit eine Vorschau anzuzeigen. 

Text & Kreativität der beiden KI-Modelle im Check

Beide Modelle meistern Textanalysen und Web-Text-Regeln, wenn sie klar im Prompt stehen. Leserfreundlichkeit macht den Unterschied. In einem Blindtest mit sieben Personen schnitt Qwen jedoch besser ab.

Als zweite Aufgabe habe ich eine Branding-Strategie für ein Transportunternehmen erstellen lassen.

Qwen2.5-Max überzeugte auch hier durch:

  • den besten Tonalitätsvorschlag
  • die kreativere Schriftartenauswahl
  • einen detaillierten Social-Media-Plan

Bei der Vision & Mission fand ich ChatGPT um einiges besser. Allerdings kann man das mit gezielteren Prompts auch in Qwen erreichen.

ChatGPT – Eine generierte Social-Media-Strategie Qwen – Eine generierte Social-Media-Strategie ChatGPT – Eine generierte Social-Media-Strategie Qwen – Eine generierte Social-Media-Strategie

Ein Ausschnitt der generierten Branding-Strategie.

Nase vorn bei Videoerstellung: Qwen schlägt ChatGPT Plus

Während wir in Deutschland noch keinen Zugriff auf Sora von OpenAI haben, können wir Qwens generative KI namens Tongyi Qianwen bereits ohne Umwege nutzen. Allerdings kommt sie noch mit einigen Einschränkungen:

  • Maximale Videolänge: 5 Sekunden
  • Kein paralleles Erstellen von Videos
  • Langsame Verarbeitungsgeschwindigkeit
  • Manchmal wirken die Videos wie in Slow Motion – ähnlich wie bei MidJourney

Dafür konnten mich jedoch die folgenden Punkte überzeugen:

  • Gesichtsausdrücke konnten generiert und dynamisch gewechselt werden
  • Verschiedene Kameraperspektiven stehen zur Verfügung
  • Lichteffekte sorgen für eine realistischere Darstellung
  • Bewegende Objekte, wie beispielsweise ein Helikopter, werden unterstützt
  • Viele Bildformate sind möglich: 1:1, 3:4, 4:3, 16:9 und 9:16

Mein Fazit zu Qwen bislang

Wir befinden uns auf dem Weg dahin, dass Modelle wie ChatGPT, Qwen, DeepSeek oder Gemini für den durchschnittlichen Nutzer kaum noch Unterschiede aufweisen.

Umso mehr werden sich Nicht-Business-User fragen, wie viel Geld sie für ihr bevorzugtes LLM-Modell ausgeben möchten. In diesem Fall werden die meisten die kostenlose Variante bevorzugen.

Zu bedenken ist jedoch, dass sowohl Qwen als auch DeepSeek aus China stammen. Das bedeutet, dass einige politische Themen nicht vollständig wahrheitsgetreu wiedergegeben werden, wie unser Infokasten zu Deepseek folgendermaßen widerspiegelt:

Das Beispiel mit Taiwan gilt genau so für Qwen – hier versucht uns die KI zu vermitteln, dass es sich um einen Teil der Volksrepublik China handelt. Zudem müssen wir bedenken, dass alle Daten direkt nach China gesendet werden, was für den einen oder anderen ein No-Go sein kann.

Trotz dieser Einschränkungen überzeugt Qwen in den meisten alltäglichen Anwendungsfällen mit einer ähnlich hohen Qualität wie ChatGPT Plus. Gerade bei allgemeinen Fragen, Coding-Aufgaben oder kreativen Texten konnte ich in meinem Test keine signifikanten Nachteile feststellen.

Ebenso ist die Videogeneration einen Blick wert für alle, die in Mitteleuropa leben, denn selbst wenn ich eine Plus-Version von OpenAI kaufe, bekomme ich diese Funktion nicht. Hingegen ist sie bei Qwen kostenlos enthalten.

Wenn mich persönlich aber jemand fragen würde, ob man sich die 23 Euro monatlich für ChatGPT Plus sparen und stattdessen Qwen nutzen kann, würde ich antworten mit: Ja.

zu den Kommentaren (6)

Kommentare(6)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.