Anthropic stellt Claude 3.5 Sonnet vor und setzt neue KI-Benchmarks

Gábor Bíró 21. Juni 2024
3 Min. Lesezeit

Das neue Modell für künstliche Intelligenz von Anthropic, Claude 3.5 Sonnet, setzt neue Industriestandards in Bezug auf Schlussfolgerungen, Wissen und Programmierfähigkeiten. Das Modell arbeitet doppelt so schnell wie sein Vorgänger, zeichnet sich durch komplexe Aufgaben aus und verbessert die Zusammenarbeit mit der neuen Artifacts-Funktion.

Anthropic stellt Claude 3.5 Sonnet vor und setzt neue KI-Benchmarks
Quelle: Anthropic

Anthropic hat sein neuestes und fortschrittlichstes Modell für künstliche Intelligenz, Claude 3.5 Sonnet, vorgestellt, das im Vergleich zu früheren Modellen deutliche Verbesserungen in Bezug auf Leistung und Fähigkeiten aufweist. Zu den wichtigsten Fortschritten des neuen Modells gehören:

  • Übertrifft Wettbewerbermodelle wie GPT-4o von OpenAI, Gemini 1.5 Pro von Google und Llama 3 400B von Meta in 7 von 9 Gesamt-Benchmarks und 4 von 5 Vision-Benchmarks.
  • Setzt neue Industriestandards für Schlussfolgerungen auf Hochschulniveau (GPQA), Wissen auf Bachelor-Niveau (MMLU) und Programmierkenntnisse (HumanEval).
  • Arbeitet doppelt so schnell wie Anthropic's bisheriges Topmodell, Claude 3 Opus.
  • Zeichnet sich durch das Schreiben und Übersetzen von Code, die Handhabung mehrstufiger Workflows und die Interpretation von Diagrammen und Grafiken aus.
  • Zeigt ein besseres Verständnis für Nuancen, Humor und komplexe Anweisungen.
  • Generiert hochwertige Inhalte mit einem natürlichen, nachvollziehbaren Ton.
  • Löst 64 % der Probleme in internen agentischen Codierungstests, verglichen mit 38 % bei Claude 3 Opus.
  • Übertrifft Claude 3 Opus bei Standard-Vision-Benchmarks und zeigt verbesserte visuelle Schlussfolgerungen und Texttranskriptionen von unvollkommenen Bildern.

Diese Verbesserungen machen Claude 3.5 Sonnet zu einem leistungsstarken Werkzeug für komplexe Aufgaben wie den kontextbezogenen Kundensupport und die Orchestrierung mehrstufiger Workflows.

Zusammen mit dem neuen Modell stellte Anthropic die Artifacts-Funktion vor, die die Zusammenarbeit und Produktivität verbessern soll. Diese innovative Funktion ermöglicht es Nutzern, KI-generierte Inhalte – wie Code-Snippets und Textdokumente – in Echtzeit innerhalb der Chat-Oberfläche anzuzeigen, zu bearbeiten und darauf aufzubauen. Artifacts verwandelt Claude in einen dynamischen kollaborativen Arbeitsbereich, der es Teams ermöglicht, KI-generierte Inhalte nahtlos in ihre Projekte und Workflows zu integrieren. Design- und UX-Teams können Artifacts beispielsweise nutzen, um gemeinsam UI-Prototypen zu erstellen, zu iterieren und zu verfeinern und dabei Claudes Verständnis von Designprinzipien und die Fähigkeit zur Generierung visueller Elemente zu nutzen.

Anthropic betont sein Engagement für Sicherheit und Datenschutz bei Claude 3.5 Sonnet. Das Modell wurde rigorosen Tests unterzogen und darauf trainiert, Missbrauch zu reduzieren, wobei externe Experten wie das britische Artificial Intelligence Safety Institute (UK AISI) einbezogen wurden. Anthropic hat auch Feedback von Experten für Kindersicherheit eingearbeitet, um Klassifikatoren zu aktualisieren und Modelle zu optimieren. Das Unternehmen bekräftigt seine Haltung zum Datenschutz und erklärt, dass nutzerseitig übermittelte Daten nicht ohne ausdrückliche Genehmigung zum Trainieren seiner generativen Modelle verwendet werden. Diese Maßnahmen spiegeln Anthropic's Bemühungen wider, potenzielle Risiken anzugehen und das Vertrauen der Nutzer in seine KI-Technologie aufrechtzuerhalten.

Das neue KI-Modell ist kostenlos auf Claude.ai und der Claude iOS App verfügbar, mit höheren Ratenbegrenzungen für Claude Pro- und Team-Abonnenten. Nutzer können auch über die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI auf Claude 3.5 Sonnet zugreifen. Anthropic plant, die Claude 3.5-Modellfamilie im Laufe dieses Jahres mit der Veröffentlichung von Claude 3.5 Haiku und Claude 3.5 Opus zu vervollständigen. Das Unternehmen entwickelt außerdem neue Funktionen und Integrationen, darunter eine Memory-Funktion, die es Claude ermöglichen wird, sich Nutzerpräferenzen und den Interaktionsverlauf zu merken.

Gábor Bíró 21. Juni 2024