Update 14.5.24: GPT-4o ist in der Schweiz bereits ausgerollt
An seiner Entwicklerkonferenz am Montag hat OpenAI mit GPT-4o einen Meilenstein in Sachen Sprachassistenten vorgestellt. Das hochmoderne KI-System vereint blitzschnelle Spracherkennung mit beeindruckendem Text- und Bildverständnis – und es antwortet so natürlich und treffend, dass man fast vergessen könnte, mit einer Maschine zu sprechen. Verglichen mit Siri, Alexa und Google Assistant, die oft genug für Frust sorgen, könnte GPT-4o endlich der Assistent sein, auf den viele gewartet haben.
GPT-4o auf dem Niveau eines menschlichen Gesprächspartners:
Während herkömmliche Sprachassistenten oft mehrere Sekunden brauchen, um eine Anfrage zu verarbeiten, liefert GPT-4o seine Antworten quasi in Echtzeit. Mit einer durchschnittlichen Reaktionszeit von nur 320 Millisekunden fühlt sich die Interaktion beinahe so flüssig an wie ein Gespräch von Mensch zu Mensch.
Dabei erreicht das System in puncto Textverständnis und Programmierfähigkeiten das Niveau des Vorgängers GPT-4, arbeitet aber doppelt so schnell und ist über die API nur noch halb so teuer. Gerade bei Texten in anderen Sprachen als Englisch hat OpenAI enorme Fortschritte erzielt. Und auch im Bereich Computer Vision wurde die Messlatte noch einmal deutlich höher gelegt.
Live-Demos verblüffen das Publikum:
In einer spannenden Präsentation auf der Entwicklerkonferenz gewährte OpenAI erstaunliche Einblicke in die Fähigkeiten von GPT-4o:
- Per Kamera nimmt der Assistent die Mimik und Gestik des Nutzers auf und erkennt so dessen emotionale Verfassung. Wenn jemand gestresst oder nervös wirkt, reagiert GPT-4o mit aufmunternden und beruhigenden Worten. Es erkennt sogar, wenn sich jemand über eine gelungene Aufgabe freut und teilt diese Begeisterung.
- GPT-4o beherrscht über 100 Sprachen und kann jederzeit zwischen ihnen hin- und herübersetzen. In einer Demo dolmetschte das System eine Unterhaltung zwischen einem englischsprachigen und einem italienischsprachigen Nutzer – und das absolut flüssig und fehlerfrei.
- Komplizierte Sachverhalte erklärt GPT-4o geduldig Schritt für Schritt und passt sich dem Lerntempo des Nutzers an. So führte der Assistent einen Schüler behutsam an die Lösung einer kniffligen Matheaufgabe heran, ohne zu viel zu verraten. Dabei gab er sogar Tipps zur richtigen Notation.
- Mit einer erstaunlichen stimmlichen Bandbreite schlüpft GPT-4o in unterschiedliche Rollen und Charaktere. Ob einfühlsames Schlaflied, witziger Sportkommentar oder extrem sarkastischer Sprücheklopfer – das System beherrscht viele Stimmungen und Tonlagen und setzt sie sehr überzeugend ein.
- Neben gesprochener Sprache versteht GPT-4o auch Bildinhalte. Egal ob Gegenstände, Tiere oder Schrift – alles, was die Kamera erfasst, kann das System erkennen, beschreiben und sogar übersetzen. So identifizierte GPT-4o in einer Demo auf Spanisch die Namen der gezeigten Objekte.
KI wie aus einem Science-Fiction-Film
„Es fühlt sich an wie KI aus einem Film“, schwärmte OpenAI-CEO Sam Altman, sichtlich stolz auf die Leistung seiner Firma. Mit GPT-4o will er fortschrittlichste Technologie für jedermann zugänglich und im Alltag nutzbar machen. Und tatsächlich: Verglichen mit diesem Können wirken Apples Siri und Amazons Alexa fast schon etwas altbacken.
Breite Verfügbarkeit
Nutzer können den neuen Wunderassistenten ab sofort in der kostenlosen Version von ChatGPT ausprobieren. Und ausgewählte Partner von OpenAI bekommen in den nächsten Wochen sogar Zugriff auf die Sprach- und Videofunktionen von GPT-4o. Zwar dürfte das System sicher noch nicht in allen Belangen perfekt sein – doch die Richtung stimmt und macht Lust auf mehr.
Ausblick
Mit GPT-4o demonstriert OpenAI eindrucksvoll, welche Möglichkeiten in moderner KI stecken und wie natürlich sich die Interaktion mit Computern inzwischen gestalten lässt. Das dürfte den Konkurrenten wie Google, Apple, Amazon und Microsoft zu denken geben, die mit ihren eigenen Sprachassistenten ins Hintertreffen zu geraten drohen.
Für die Nutzer hingegen sind es gute Nachrichten. Künftig dürfen wir uns auf Systeme freuen, die uns immer besser verstehen, auf unsere Bedürfnisse eingehen und uns im Alltag wirklich sinnvoll unterstützen. Es bleibt spannend zu beobachten, wie der Wettlauf um die KI-Krone weitergeht und welche neuen Anwendungen uns noch erwarten. GPT-4o von OpenAI hat hier zweifellos neue Maßstäbe gesetzt.