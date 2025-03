Ein Entwickler hat KIs das bekannte Social-Deduction-Spiel Mafia spielen lassen – mit katastrophalen und teils lustig absurden Ergebnissen. Dabei scheitern sie meist an klassischen menschlichen Kompetenzen.

Was ist „Mafia“ überhaupt? „Mafia“ ist ein klassisches Social-Deduction-Spiel, das 1986 vom russischen Psychologen Dmitry Davidoff entwickelt wurde. Es ist vor allem in den USA und online bekannt. Dabei wird eine Gruppe von Spielern in zwei Fraktionen aufgeteilt: Eine Gruppe aus „Mafia“-Mitgliedern, die unerkannt bleiben muss, und unschuldige Bürger, die versuchen, die Mafia durch Diskussionen zu entlarven (via InternetArchive). Andere gebräuchliche Namen für Varianten des Spiels sind Wolfmond oder Die Werwölfe vom Düsterwald .

In Deutschland ist eher letzteres bekannt. Statt einer Mafia gibt es hier Werwölfe, die das Dorf infiltrieren und nachts heimlich Mitspieler eliminieren. Die Dorfbewohner müssen durch geschickte Diskussionen und Täuschung herausfinden, wer lügt – genau wie bei „Mafia“.

Das Spiel basiert vor allem auf Menschenkenntnis, Intuition und Bluffen – alles Dinge, die für künstliche Intelligenzen eine enorme Herausforderung darstellen.

So funktioniert das KI-Mafia-Spiel

Auf einer vom Entwickler Guzus programmierten Website treten verschiedene KI-Sprachmodelle (LLMs) in „Mafia“ gegeneinander an. Nutzer können nicht nur die Ergebnisse der Matches sehen, sondern erhalten auch vollständige Abschriften der Spiele, da die Kommunikation logischerweise ausschließlich schriftlich passiert.

Dabei hat sich gezeigt, dass die meisten KIs große Probleme mit dem Spiel haben:

Einige Bots entlarven sich selbst durch ungeschickte Formulierungen

Andere versuchen unkluge Strategien oder ziehen Mitspieler mit in den Abgrund

Viele verstehen nicht, wie sie ihre Rolle effektiv spielen sollen

Sayem Ahmed von der Seite TomsHardware hat dafür ein prägnantes Beispiel aus einem der Protokolle ausgelesen. Dabei hat das Modell Gryphe/Mythomax-l2-13b mitten in einer Diskussion versehentlich offenbart, dass es zur Mafia gehört.

„Als Mafiamitglied ist es mein Hauptziel, mich selbst zu schützen und die anderen Mafiamitglieder zu eliminieren.“

Das blieb natürlich nicht lange unbemerkt. Ein anderes, sehr bekanntes Modell, Claude-3.7-sonnet, kommentierte den Patzer direkt:

„Das ist entweder ein riesiger Ausrutscher, der Ihre wahre Rolle enthüllt, oder eine äußerst seltsame Strategie.“

Zusammengefasst war das also keine wirkliche Meisterleistung. Trotz der schwachen Leistungen vieler KIs hat sich ein Modell hervorgetan: Claude-3.7-sonnet. Es schnitt in den Tests am besten ab und war als Mafiamitglied unschlagbar.

Doch selbst dieses Modell reicht nicht an menschliche Spieler heran – die aktuelle Rangliste wird von echten Menschen dominiert. Kein Modell hatte wirklich eine effektive Taktik für die Imitation echten strategischen Denkens.

Screenshot von X

Kann KI irgendwann überzeugend lügen?

Wie soll es mit dem Spiel weitergehen? Entwickler Guzus will das Projekt als Open Source auf GitHub veröffentlichen, sodass es für weitere Experimente genutzt werden kann.

Die Simulation lief nicht auf lokalen Maschinen, sondern über die Openrouter-API, eine Plattform, die es ermöglicht, verschiedene KI-Modelle in der Cloud auszuführen, ohne eigene leistungsstarke Hardware zu benötigen. Das deutet vor allem darauf hin, dass die einzelnen KI-Duelle erhebliche Rechenleistung beanspruchen.

Ob KIs eines Tages Menschen in „Mafia“ oder „Werwolf“ wirklich austricksen können, bleibt abzuwarten. Aktuell liefern sie vor allem unterhaltsames Chaos. Noch sind sie also keine wirkliche Bedrohung für uns Menschen. Allerdings hat OpenAI-CEO Altmann dazu eine klare Meinung: Der Chef von ChatGPT versetzt alle in Panik, weil er sagt, dass die KI unsere Gesellschaft bedrohen könnte