Es ist ein erbitterter Kampf um die Krone der KI-Sprachmodelle entbrannt. GPT-4 von OpenAI galt bisher als ungeschlagener Champion, doch diese Woche betritt ein neuer Herausforderer die Arena: Claude 3 von Anthropic. Mit beeindruckenden Fähigkeiten und einer Performance, die sogar in der KI-Szene für Aufsehen sorgt, hat dieser Newcomer das Zeug dazu, den Thron zu erobern.
Meine bisherige Typologie der KI-Sprachmodelle
Bisher hatte ich eine einfache Einteilung der bekannten KI-Sprachmodelle:

ChatGPT: Der pragmatische Macher, der Dinge hands-on erledigt.

Google Gemini: Der Nerd, der es irgendwie besser machen will, aber nicht so praktisch umsetzen kann. Bei Gemini hatte ich das Gefühl, dass Google es überstürzt auf den Markt gebracht hat und es noch viele Ecken und Kanten aufweist.

Claude 2: Der Schönling, elegant, aber etwas oberflächlich.
Doch mit Claude 3 hat sich diese Typologie grundlegend geändert. Im Gegensatz zu Gemini wirkt Claude 3 sehr solide und ausgereift.
Claude 3 mit Opus: Ein beeindruckendes Erlebnis
Ich habe Claude 3 mit dem besten Modell „Opus“ getestet und bin schlichtweg begeistert. Subjektiv ist das Modell absolut auf Augenhöhe mit ChatGPT4. Der Output ist übersichtlich strukturiert und wird nicht unterbrochen.
Besonders hervorzuheben ist das riesige Kontextfenster. Ich habe testweise komplette Verlagsbücher mit 200.000 Zeichen hochgeladen und Claude gebeten, diese Kapitel für Kapitel mit je 3 Bullet Points zusammenzufassen. Das Ergebnis war schlichtweg beeindruckend: Akkurat, wohldurchdacht und korrekt. Von der früheren Oberflächlichkeit keine Spur mehr.
Offizielle Tests vs. Praxiserfahrung
Offizielle Benchmarks attestieren Claude 3 in vielen Bereichen leichte Vorteile gegenüber ChatGPT4. Allerdings sagen diese Tests wenig darüber aus, wie sich die Modelle in der Praxis „anfühlen“. Hier müsste man fairerweise auch GPT4 Turbo testen, das nochmal einen Tick besser ist als das normale GPT4.

Verschiedene Claude-Modelle
Claude 3 ist in verschiedenen Varianten verfügbar:
- Opus: Tiefes Verständnis komplexer Aufgaben
- Haiku: Die schnelle Version
- Vision: Verarbeitet auch Bilder
Das Top-Modell Opus kostet allerdings 20 USD pro Monat und ist nur mit einer Rechnungsadresse in UK oder USA buchbar. ChatGPT hat mir dafür den Lake District empfohlen, ein Unesco Weltkulturerbe…
Mein Fazit
Claude 3 hat mich rundum überzeugt und ist ein sehr solides Sprachmodell. Für das Zusammenfassen von Texten ist es künftig meine erste Wahl.
Für komplexere Aufgaben bleibe ich vorerst bei meinem vertrauten ChatGPT, das ich in- und auswendig kenne. Und Google Gemini? Beweist vor allem, dass man auch mit viel Geld nicht alles auf die Reihe kriegt.
Die KI-Landschaft bleibt spannend und es ist faszinierend zu beobachten, wie sich die Modelle weiterentwickeln. Claude 3 ist definitiv ein Meilenstein und ich bin schon sehr gespannt, was die Zukunft noch bringen wird.
Claude 3 Opus im Detail:
- Übersetzungsfähigkeit: Claude 3 Opus übertrifft andere Modelle bei der akkuraten Übersetzung der komplexen tscherkessischen Sprache.
- Die Nadel im Heuhaufen finden: In einem Test mit einem extrem langen Text zu verschiedenen Themen und einer präzisen Frage konnte Claude nicht nur den versteckten Satz finden, sondern war sich auch „bewusst“, dass es sich um einen Test handelte. Dies sorgte für einiges Aufsehen in der KI-Szene.
- Leistungsfähigkeit: Claude 3 Opus kann ein über zweistündiges Video mit nur einem Befehl in einen detaillierten Blogbeitrag umwandeln.