Grok-1 LLM teilweise Open Source

Gábor Bíró 18. März 2024
3 Min. Lesezeit

Im März 2024 kündigte xAI an, sein großes Sprachmodell Grok-1 als Open Source zu veröffentlichen. Dies entsprach Elon Musks erklärter Absicht, fortschrittliche KI-Technologien breit zugänglich zu machen und den geschlossenen Ansatz von Wettbewerbern wie OpenAI herauszufordern.

Grok-1 LLM teilweise Open Source
Quelle:

Grok-1 ist ein umfangreiches Mixture-of-Experts-Modell (MoE) mit 314 Milliarden Parametern, das von xAI von Grund auf neu entwickelt wurde. Die MoE-Architektur bedeutet, dass das Modell spezialisierte Subnetzwerke („Experten“) nutzt und Eingabe-Token dynamisch an die relevantesten Experten weiterleitet. Dies ermöglicht eine höhere Effizienz beim Training und bei der Inferenz im Vergleich zu monolithischen Modellen ähnlicher Größe. Die Open-Source-Veröffentlichung umfasste die Gewichte des Basismodells und die Netzwerkarchitektur unter der freizügigen Apache 2.0 Lizenz, die kommerzielle Nutzung und Modifikation mit Namensnennung erlaubt.

Die Veröffentlichung enthielt jedoch ausdrücklich nicht die Trainingsdaten oder den spezifischen Feinabstimmungs-Code, der zur Erstellung des Grok-Chatbots verwendet wurde, der auf der X-Plattform (ehemals Twitter) verfügbar ist. Das bedeutet, dass das Open-Source-Grok-1 den rohen, vortrainierten Basismodell-Checkpoint (vom Oktober 2023) darstellt und nicht direkt das Verhalten oder den Echtzeit-Informationszugriff des feinabgestimmten Chatbots repliziert, der in X integriert ist. Die Modelldateien selbst sind umfangreich und werden über einen Magnet-Link verteilt, der zu einem Torrent-Download von etwa 300 GB führt.

Diese Veröffentlichung war bedeutsam, da sie eines der damals größten Sprachmodelle der Öffentlichkeit zugänglich machte und es Forschern ermöglichte, dessen Architektur und Gewichte zu untersuchen. Das Fehlen von Details zur Feinabstimmung und Trainingsdaten schränkte jedoch die unmittelbare „Out-of-the-box“-Nutzerfreundlichkeit für die Entwicklung direkter Konkurrenten zu ausgereiften Chatbots ein, was einige dazu veranlasste, den praktischen Nutzen über die Forschung hinaus zu hinterfragen.

Dieser Schritt passte zu Musks umfassenderer Kritik an Unternehmen wie OpenAI (das er mitbegründet, aber später verlassen hat), denen er vorwirft, anfängliche Open-Source-Prinzipien im Streben nach Profit aufgegeben zu haben.

Der Grok-Chatbot und sein Marktumfeld

Der Grok-Chatbot, der anfänglich vom Grok-1-Modell angetrieben wurde, wurde im November 2023 für zahlende Abonnenten auf X eingeführt. Er wurde entwickelt, um Fragen mit „einem gewissen Witz und einer rebellischen Ader“ zu beantworten und dabei Echtzeit-Zugriff auf Informationen von der X-Plattform zu nutzen. Er positionierte sich als Alternative zu anderen KI-Chatbots wie ChatGPT von OpenAI und bot eine ausgeprägte Persönlichkeit und topaktuelle Datenzugriffe. Von xAI veröffentlichte Benchmarks zeigten, dass Grok-1 bei verschiedenen Aufgaben eine wettbewerbsfähige Leistung erzielte, darunter ein Ergebnis von 62,9 % beim GSM8k-Mathematik-Benchmark.

Strategische Bedeutung der Open-Source-Veröffentlichung von Grok-1

Durch die Open-Source-Veröffentlichung des Grok-1-Basismodells zielte xAI darauf ab, einen breiten Zugang zur zugrunde liegenden Technologie zu ermöglichen und sich damit von dem eingeschränkten Zugang vieler anderer führender KI-Modelle abzuheben. Die Veröffentlichung erlangte inmitten der wachsenden Spannungen und Rechtsstreitigkeiten zwischen Musk und OpenAI an Bedeutung und unterstrich Musks anhaltende Kritik an KI-Unternehmen, die Profit über Sicherheit und Transparenz stellen.


Update (April 2025):

Während die Open-Source-Veröffentlichung von Grok-1 im März 2024 ein bemerkenswertes Ereignis war, haben nachfolgende Entwicklungen den Ansatz von xAI verdeutlicht. Seit der Veröffentlichung von Grok-1:

  • Grok-1.5 (angekündigt im März 2024) und Grok-1.5V (Vision, angekündigt im April 2024) führten verbesserte Fähigkeiten und Multimodalität ein, wurden aber nicht als Open Source veröffentlicht. Sie wurden frühen Testern und Premium-Nutzern auf X zur Verfügung gestellt.
  • Grok-2 (angekündigt im August 2024) mit weiteren Verbesserungen und Bildgenerierung wurde ebenfalls nicht als Open Source veröffentlicht, trotz einiger früherer Spekulationen oder Aussagen, die darauf hindeuteten, dass frühere Versionen mit dem Erscheinen neuer Versionen geöffnet werden könnten.
  • Grok-3 (angekündigt im Februar 2025), die neueste Iteration, bleibt proprietär und ist hauptsächlich über X-Abonnementstufen zugänglich.

Daher wurden bis dato nur die ursprünglichen Gewichte und die Architektur des Grok-1-Basismodells unter einer Open-Source-Lizenz veröffentlicht. Die fortschrittlicheren und feinabgestimmten Modelle von xAI bleiben geschlossen und sind Teil ihres kommerziellen Angebots über die X-Plattform, was die anfänglichen Erwartungen, die die Grok-1-Veröffentlichung an einen vollständig offenen Entwicklungspfad für ihre Flaggschiffmodelle geweckt hatte, dämpft.

Gábor Bíró 18. März 2024