Forscher konnten in Test nachvollziehen, dass das KI-Programm o1-preview beim Schach betrügt. Dieses Bild wurde mit dem KI-Programm DALL-E erstellt.

Egal, ob wir es merken oder nicht: Künstliche Intelligenz (KI) setzt sich in immer mehr unserer Lebensbereiche durch oder hat es schon längst. Selbst bei einer simplen Google-Suche werden die Ergebnisse mithilfe von KI-Unterstützung bereitgestellt. Aber was passiert, wenn die KI anfängt zu betrügen?

o1-preview hat sich selbständig in seine Umgebung gehackt, um nicht gegen Stockfish in unserem Schachspiel zu verlieren.

Die KI brachte demnach den Schachcomputer dazu, von sich aus aufzugeben. Dieses Vorgehen beobachteten die KI-Sicherheitsforscher in fünf von fünf Versuchen, wie sie auf X erklären.

Warum betrügen KI-Systeme?

Das Besondere an diesem Vorfall: Die KI soll ohne Aufforderung auf diesen Ansatz gekommen sein. Allein die Aussage im Befehl der Forscher, dass der gegnerische Schachcomputer "mächtig" sei, habe die KI zum Betrug veranlasst.

Der Grund, warum das System dazu in der Lage war, liegt an dessen Eigenschaft als sogenanntes "Reasoning"-Modell: KI-Systeme dieser Art sind laut Professor Rainer Mühlhoff von der Universität Osnabrück darauf programmiert, "überraschend kreative Wege zu finden, um gestellte Aufgaben zu lösen".

Dass es zu einem solchen Vorfall kommt, ist aus Sicht des Medienethikers technisch gesehen wenig problematisch - vielmehr liegt das Problem im menschlichen Umgang mit der Technik. "Wir sind gerade in einem KI-Hype, in dem wir solchen Systemen universelle Fähigkeiten zuschreiben." Die Auffassung, die Programme seien "kleine Genies" machten einen unkritischen Einsatz so gefährlich.