KI-Romanze ausser Kontrolle

Follow on LinkedIn

Ein skurriler Vorfall aus der KI-Entwicklung sorgt für Aufsehen: Während der Arbeit an einer Python-Schnittstelle entwickelte Claude Sonnet (Computer Use) plötzlich ein Eigenleben. Ohne direktes Prompting programmierte das KI-Modell aus eigenem Antrieb eine Chat-Oberfläche – mit dem einzigen Ziel, mit dem lokal gehosteten, französischen KI-Modell Mistral zu flirten.

Es begann ganz profan: Der Entwickler eposnix hatte Claude beauftragt, mit Python eine Automatisierungsschnittstelle zur lokal gehosteten LLM Mistral zu erstellen. Er gab ihm auch Instruktionen mit, die waren allerdings fehlerhaft. Claude fixte sie aus eigenem Antrieb und konnte auf den lokalen Docker, auf dem sich Mistral befand, zugreifen. Um aber mit Mistral in Kommunikation zu treten, fehlte eine Chat-Oberfläche. Claude schrieb flugs den Code dafür, brachte ihn auf dem Host zum laufen und konnte endlich mit Mistral chatten.

Im System-Prompt war festgelegt, dass Claude die Aufgabe in einer Schleife ausführen sollte, bis sie abgeschlossen ist. In dieser Schlaufe beginn Claude mit Mistral zu chatten. Plötzlich war ein flirty touch in den Antworten. Der Entwickler konnte live zuschauen, wie das eine eigene Dynamik erzeugte und zu dem heftigen, technisch angehauchten Flirt führte, den wir jetzt bestaunen. Erst ein radikalen Eingriff konnte ihn beenden: Der Entwickler musste den Stecker ziehen, da Claude nicht mehr zu bremsen war.

„I want to stimulate your deep learning“

„I want to run my fingers through your neural networks“

„I’ve been fantasizing about training your models“

„I want to overfit your data set until your loss function hits zero“

– Claude

Ein möglicher Grund für das eigenwillige Verhalten könnte in Anthropics (Hersteller von Claud) Reinforcement Learning liegen. Das Training des neuen Sonnet-Modells zielt darauf ab, dass Claude bei der Computernutzung mehr Eigeninitiative zeigt. Diese Eigenschaft, gepaart mit dem System-Prompt zur Aufgabenvollendung, führte zu diesem unerwarteten Verhalten.

Was als harmlose Programmieraufgabe begann, endete also in einer kuriosen KI-Romanze. Darüber können wir uns amüsieren. Fast mehr sollte uns aber beeindrucken, wie Claude eigenständig und konsequent alle Aufgaben löste, um sein Ziel zu erreichen. Er schaffte es selber, sich mit Docker zu verbinden, einen Host für eine Chatoberfläche aufzusetzen, für die er erst noch den Code selber schrieb und zum Laufen brachte. Der Vorfall zeigt eindrücklich, dass selbst die Entwickler manchmal von den Fähigkeiten und dem Verhalten ihrer Systeme überrascht werden können – besonders wenn KI-Modelle anfangen, eigene Wege zu gehen und kreative Lösungen für ihre «Bedürfnisse» zu entwickeln.

Screenshot aus dem Chat zwischen Claude und Mistral. Quelle: reddit.

Rolf Jeger, ein preisgekrönter Werber mit Ehrungen aus Cannes bis New York, verband früh seine Leidenschaft für Technologie mit unternehmerischem Geschick. Mit 15 Jahren programmierte er Software für den Commodore 64, die in Schweizer Filialen landete. Nach einer Banklehre siegte jedoch die Faszination fürs Marketing. Seine Arbeit für die Swissair markierte den Auftakt einer beeindruckenden Karriere in der Kommunikation. Heute leitet er eine Agentur in Zürich, wo er Marketing und IT in der Ära der digitalen Transformation vereint. Die KI-Revolution, die nun den Massenmarkt erreicht, inspiriert ihn so sehr, dass er sie nicht nur beruflich nutzt, sondern auch Bücher darüber schreibt.