Ist diese KI wirklich der neue Spitzenreiter? (Bild: Flaticon / xAI)

Täglich werden kleinere und größere KIs angekündigt, die sich in verschiedenen Bereichen gegenseitig übertreffen wollen. Oftmals geschieht das jedoch nur in bestimmten Benchmarks oder bei komplexeren Aufgaben wie der Programmierung. Für den durchschnittlichen Nutzer macht das, laut Jan, keinen großen Unterschied.

Trotzdem bezeichnet Elon Musk Grok 3, das neue Large Language Model (LLM) seines KI-Unternehmens xAI, als die schlauste KI der Welt. Doch was steckt hinter dieser Behauptung?

Elon Musk gilt als einer der reichsten Menschen der Welt aber auch einer der kontroversesten. Es gab unter anderem transphobe Äußerungen, Vorwürfe von Antisemitismus, weil er durch seine Aussage, der jüdische Investor George Soros hasse die Menschheit, die um Soros kursierende Verschwörungstheorie weiter anheizte und Diskussionen um seine Einstellung zu Free Speech.

Seit der Übernahme von Twitter (jetzt X) durch Musk gibt es vermehrt Beschwerden über den Umgang mit Hate Speech, Fake News und politischer Einflussnahme auf der Plattform. Zuletzt griff Musk auch persönlich auf X diverse europäische Staatsoberhäupter an und mischt sich aktiv in den deutschen Bundestagswahlkampf ein. In der amerikanischen Politik gilt er als Trump-Berater und soll unter dem neuen Präsidenten das neu geschaffene Amt für Prozessoptimierung besetzen. Nach Trumps Vereidigung im Januar 2025 zeigte Musk auf einer öffentlichen Veranstaltung eine Geste, die vielfach als Hitlergruß interpretiert wurde.

Auch in die deutsche Politik mischte er sich zuletzt immer wieder ein. Etwa durch einen stark kritisierten Gastbeitrag in der Zeitung Welt zu Gunsten der AfD oder indem er der AfD-Kanzlerkandidatin Alice Weidel über X eine Plattform für ihren Livestream bot und dabei mehrfach Falschaussagen tätigte.

Grok 3: Das steckt drin

Musk und einige Entwickler von xAI haben Grok 3 in einem Livestream auf X vorgestellt. Dazu gab es auch eine Mini-Version sowie ein spezielles Reasoning-Modell.

Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von Twitter, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.

Twitter-Inhalte erlauben

Ich bin damit einverstanden, dass mir Inhalte von Twitter angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum Twitter-Inhalt

Die KI soll laut Musk scary smart sein – also so schlau, dass es angsteinflößend ist. Dementsprechend soll Grok 3 über bessere logische Schlussfolgerungen, mehr Rechenleistung und eine höhere Anpassungsfähigkeit verfügen als ChatGPT-4o.

Das heißt: Das Modell rechnet schneller, versteht komplexe Zusammenhänge präziser und kann noch flexibler auf unterschiedliche Fragestellungen reagieren.

Was laut xAI in Grok 3 steckt:

Die KI wurde angeblich mit dem Colossus-Supercomputer trainiert (100.000 Nvidia H100 GPUs).
200 Millionen GPU-Stunden sollen für das Training aufgewendet worden sein – zehnmal mehr als bei Grok 2.
Das Modell wurde auf künstlich generierten Daten trainiert. Diese synthetischen Daten sollen ein diverses und kontrolliertes Datenset gewährleisten und Bedenken hinsichtlich des Datenschutzes verringern.
Die Entwickler haben Reinforcement Learning eingesetzt, eine Methode des maschinellen Lernens, bei der das Modell anhand einer Belohnungsfunktion ihren Output bewertet und verbessert.
Außerdem wurde Reinforcement Learning with Human Feedback (RLHF) angewandt: Hier bewerten echte Menschen den Output, um die Belohnungsfunktion zu verfeinern und die Qualität der KI-Inhalte weiter zu verbessern.
Kontextuelles Training soll dafür sorgen, dass die KI Antworten besser im Kontext versteht und anpasst.
Das LLM soll sich selbst korrigieren können, indem es Antworten analysiert und mit Fakten abgleicht.
Mit DeepSearch soll eine erweiterte Recherche- und Sprachfunktion nachgereicht werden.

Das große Ziel: Weniger Halluzinationen und eine höhere logische Genauigkeit.

Was sind Halluzinationen? Halluzinationen bezeichnen bei LLMs falsche oder frei erfundene Informationen. Das ist eine bekannte Schwäche aller gängigen Chatbots und der Hauptgrund, warum ihr KI-generierte Antworten stets hinterfragen solltet.

44:19 »Künstliche Intelligenz ist die neue Elektrizität« - Wir busten mit einem Experten 5 Mythen zu KI

Autoplay

Wann kommt Grok 3? In den USA sollten Grok 3 bereits einige nutzen können. Zuerst sind zahlende Abonnenten (40 US-Dollar/Monat) an der Reihe. Ein genauer Zeitplan fehlt jedoch.

In der EU und Großbritannien ist Grok 3 vorerst nicht verfügbar, da xAI Anpassungen vornehmen muss, um EU-Regularien zu entsprechen.

Grok 3: Die schlauste KI der Welt?

Was macht Grok 3 besser als andere LLMs? Laut den Benchmarks, die xAI im Livestream zeigte, ist Grok 3 insbesondere bei logischen Aufgaben wie Mathematik, Programmierung und wissenschaftlichen Fragen besser als die Konkurrenz.

Allerdings verzichtete xAI darauf, Benchmarks aus anderen Bereichen zu präsentieren – dazu gleich mehr.

Das von xAI präsentierte Benchmark. (Bild: xAI)

Auch wenn Grok 3 weniger Halluzinationen erzeugen soll, bedeutet das nicht, dass dieses Ziel bereits erreicht wurde. OpenAI setzt ebenfalls auf Selbstkorrektur, synthetische Daten und Reinforcement Learning mit menschlichem Feedback (RLHF).

Wie gut die KI wirklich ist, wird sich erst zeigen, wenn unabhängige Nutzer sie testen können.

Fragwürdige Aussagen im Livestream

Einige Aussagen von Musk und seinem Team könnten missverständlich oder irreführend sein. Deswegen wollen wir hier darauf eingehen:;

Ultimative wahrheitssuchende KI: Musk behauptete während des Streams, dass Grok 3 die ultimative wahrheitssuchende KI sei, die manchmal im Widerspruch zu dem steht, was politisch korrekt ist. Ob er damit andeuten möchte, dass andere Entwickler absichtlich Fakten verschönern, ob er Fakten oder Hintergründe aktiv anders darstellen lassen möchte oder ob es reine politische Provokation ist, ist schwierig einzuschätzen.

Die KI wird jeden Tag besser: Musk behauptet, dass das Modell jeden Tag weiter verbessert wird. Wenn damit kleinere Anpassungen gemeint waren, wäre das auch ok. Wir wollen allerdings klarstellen, dass das Training eines LLMs vor der Veröffentlichung endgültig endet – danach erfolgen nur noch kleinere Anpassungen.

Bemerkenswerte Entwicklungszeit: Musk betonte, dass xAI erst 2023 mit der Entwicklung begonnen habe, während andere Unternehmen schon seit 2019 an LLMs arbeiten. Dabei wurde nicht erwähnt, dass der eigentliche Durchbruch nicht in der Entwicklungszeit, sondern an riesigen Datenmengen und Rechenleistung liegt. Für finanzstarke Unternehmen ist es daher relativ einfach, schnell eigene KI-Modelle zu entwickeln.

Benchmarks nur in drei Bereichen: Wie gut Grok 3 in anderen Bereichen, wie beispielsweise bei sprachlichen Aufgaben abschneidet, bleibt offen. Denn Musk und sein Team haben nur Benchmarks von Logik-Aufgaben gezeigt.

Das größte Problem von ChatGPT soll jetzt gelöst werden und ich kann es kaum abwarten

von Jan Stahnke

Nach 20 Jahren: Nutzer ist begeistert, weil er mit ChatGPT endlich eine alte Datei wiederherstellen konnte

von Jan Stahnke

DeepSeek vs. ChatGPT: Die Bezahlmodelle im Vergleich

von Jonas Herrmann

Die Bezeichnung schlauste KI der Welt ist daher eher Marketing als belegbarer Fakt. Zumindest zeigt Musk mit seinem Team keine bahnbrechenden Neuerungen, die diesen Superlativ irgendwie begründen würden.

Selbst wenn Grok 3 aktuell an der Spitze wäre, sind neue Modelle von OpenAI, Google und Anthropic sicher schon in der Entwicklung.

Beim World Government Summit (11. bis 13. Februar) sagte Musk, dass dies das letzte Mal sein könnte, dass andere KIs besser sind als Grok. Das bleibt abzuwarten.

Keine Kommentarfunktion?
Aufgrund des zu erwartenden hohen Moderationsaufwandes haben wir uns entschieden, die Kommentare ins Forum zu verlagern. Dort könnt ihr wie gewohnt diskutieren:

Zum Forenthread