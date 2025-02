Ist diese KI wirklich der neue Spitzenreiter? (Bild: Flaticon / xAI)

Täglich werden kleinere und größere KIs angekündigt, die sich in verschiedenen Bereichen gegenseitig übertreffen wollen. Oftmals geschieht das jedoch nur in bestimmten Benchmarks oder bei komplexeren Aufgaben wie der Programmierung. Für den durchschnittlichen Nutzer macht das, laut Jan, keinen großen Unterschied.

Trotzdem bezeichnet Elon Musk Grok 3, das neue Large Language Model (LLM) seines KI-Unternehmens xAI, als die schlauste KI der Welt . Doch was steckt hinter dieser Behauptung?

Grok 3: Das steckt drin

Musk und einige Entwickler von xAI haben Grok 3 in einem Livestream auf X vorgestellt. Dazu gab es auch eine Mini-Version sowie ein spezielles Reasoning-Modell.

Die KI soll laut Musk scary smart sein – also so schlau, dass es angsteinflößend ist. Dementsprechend soll Grok 3 über bessere logische Schlussfolgerungen, mehr Rechenleistung und eine höhere Anpassungsfähigkeit verfügen als ChatGPT-4o.

Das heißt: Das Modell rechnet schneller, versteht komplexe Zusammenhänge präziser und kann noch flexibler auf unterschiedliche Fragestellungen reagieren.

Was laut xAI in Grok 3 steckt:

Die KI wurde angeblich mit dem Colossus-Supercomputer trainiert (100.000 Nvidia H100 GPUs).

200 Millionen GPU-Stunden sollen für das Training aufgewendet worden sein – zehnmal mehr als bei Grok 2.

Das Modell wurde auf künstlich generierten Daten trainiert. Diese synthetischen Daten sollen ein diverses und kontrolliertes Datenset gewährleisten und Bedenken hinsichtlich des Datenschutzes verringern.

sollen ein diverses und kontrolliertes Datenset gewährleisten und Bedenken hinsichtlich des Datenschutzes verringern. Die Entwickler haben Rein forcement Learning eingesetzt, eine Methode des maschinellen Lernens, bei der das Modell anhand einer Belohnungsfunktion ihren Output bewertet und verbessert.

eingesetzt, eine Methode des maschinellen Lernens, bei der das Modell anhand einer Belohnungsfunktion ihren Output bewertet und verbessert. Außerdem wurde Reinforcement Learning with Human Feedback (RLHF) angewandt: Hier bewerten echte Menschen den Output, um die Belohnungsfunktion zu verfeinern und die Qualität der KI-Inhalte weiter zu verbessern.

(RLHF) angewandt: Hier bewerten echte Menschen den Output, um die Belohnungsfunktion zu verfeinern und die Qualität der KI-Inhalte weiter zu verbessern. Kontextuelles Training soll dafür sorgen, dass die KI Antworten besser im Kontext versteht und anpasst.

Das LLM soll sich selbst korrigieren können, indem es Antworten analysiert und mit Fakten abgleicht.

Mit DeepSearch soll eine erweiterte Recherche- und Sprachfunktion nachgereicht werden.

Das große Ziel: Weniger Halluzinationen und eine höhere logische Genauigkeit.

Was sind Halluzinationen? Halluzinationen bezeichnen bei LLMs falsche oder frei erfundene Informationen. Das ist eine bekannte Schwäche aller gängigen Chatbots und der Hauptgrund, warum ihr KI-generierte Antworten stets hinterfragen solltet.

Wann kommt Grok 3? In den USA sollten Grok 3 bereits einige nutzen können. Zuerst sind zahlende Abonnenten (40 US-Dollar/Monat) an der Reihe. Ein genauer Zeitplan fehlt jedoch.

In der EU und Großbritannien ist Grok 3 vorerst nicht verfügbar, da xAI Anpassungen vornehmen muss, um EU-Regularien zu entsprechen.

Grok 3: Die schlauste KI der Welt?

Was macht Grok 3 besser als andere LLMs? Laut den Benchmarks, die xAI im Livestream zeigte, ist Grok 3 insbesondere bei logischen Aufgaben wie Mathematik, Programmierung und wissenschaftlichen Fragen besser als die Konkurrenz.

Allerdings verzichtete xAI darauf, Benchmarks aus anderen Bereichen zu präsentieren – dazu gleich mehr.

Das von xAI präsentierte Benchmark. (Bild: xAI)

Auch wenn Grok 3 weniger Halluzinationen erzeugen soll, bedeutet das nicht, dass dieses Ziel bereits erreicht wurde. OpenAI setzt ebenfalls auf Selbstkorrektur, synthetische Daten und Reinforcement Learning mit menschlichem Feedback (RLHF).

Wie gut die KI wirklich ist, wird sich erst zeigen, wenn unabhängige Nutzer sie testen können.

Fragwürdige Aussagen im Livestream

Einige Aussagen von Musk und seinem Team könnten missverständlich oder irreführend sein. Deswegen wollen wir hier darauf eingehen:;

Ultimative wahrheitssuchende KI : Musk behauptete während des Streams, dass Grok 3 die ultimative wahrheitssuchende KI sei, die manchmal im Widerspruch zu dem steht, was politisch korrekt ist. Ob er damit andeuten möchte, dass andere Entwickler absichtlich Fakten verschönern, ob er Fakten oder Hintergründe aktiv anders darstellen lassen möchte oder ob es reine politische Provokation ist, ist schwierig einzuschätzen.

Die KI wird jeden Tag besser: Musk behauptet, dass das Modell jeden Tag weiter verbessert wird. Wenn damit kleinere Anpassungen gemeint waren, wäre das auch ok. Wir wollen allerdings klarstellen, dass das Training eines LLMs vor der Veröffentlichung endgültig endet – danach erfolgen nur noch kleinere Anpassungen.

Bemerkenswerte Entwicklungszeit: Musk betonte, dass xAI erst 2023 mit der Entwicklung begonnen habe, während andere Unternehmen schon seit 2019 an LLMs arbeiten. Dabei wurde nicht erwähnt, dass der eigentliche Durchbruch nicht in der Entwicklungszeit, sondern an riesigen Datenmengen und Rechenleistung liegt. Für finanzstarke Unternehmen ist es daher relativ einfach, schnell eigene KI-Modelle zu entwickeln.

Benchmarks nur in drei Bereichen: Wie gut Grok 3 in anderen Bereichen, wie beispielsweise bei sprachlichen Aufgaben abschneidet, bleibt offen. Denn Musk und sein Team haben nur Benchmarks von Logik-Aufgaben gezeigt.

Die Bezeichnung schlauste KI der Welt ist daher eher Marketing als belegbarer Fakt. Zumindest zeigt Musk mit seinem Team keine bahnbrechenden Neuerungen, die diesen Superlativ irgendwie begründen würden.

Selbst wenn Grok 3 aktuell an der Spitze wäre, sind neue Modelle von OpenAI, Google und Anthropic sicher schon in der Entwicklung.

Beim World Government Summit (11. bis 13. Februar) sagte Musk, dass dies "das letzte Mal sein könnte, dass andere KIs besser sind als Grok". Das bleibt abzuwarten.