Künstliche Intelligenz soll Probleme der Menschheit lösen - Scheitert an Pokémon Rot, findet nach 50.000 Stunden die Arena nicht

Der YouTuber Peter Whidden hat einer KI beigebracht, Pokémon Rot mit Hilfe eines Emulators zu spielen. Er bringt sie über Belohnungspunkte dazu, die richtigen Aktionen auszuführen. Doch es kommt immer wieder zu Problemen, etwa einer „Angst“ vor Pokémon Centern und Problemen bei der Wegfindung.

Wie genau funktioniert das? Die Künstliche Intelligenz sollte das Spiel möglichst wie ein Mensch bedienen. Der YouTuber erklärt dazu, dass die KI in der Lage sei, die Steuerung selbstständig zu nutzen. Nach jeder Aktion schaut sie auf den Bildschirm und überlegt, was sie als Nächstes tun soll, genau wie ein Nutzer vor dem Gerät.

Dabei ließ er 40 Test-Sessions parallel laufen, um die Lerngeschwindigkeit zu erhöhen.

Da der Algorithmus jedoch nicht selbstständig das Ziel hat, das Spiel zu gewinnen, legte Whidden bestimmte Belohnungen fest. Um die Erkundungen zu fördern, erhielt die KI immer dann einen Belohnungspunkt, wenn sie etwas Neues sah, gemessen an der Zahl der unterschiedlichen Pixel auf dem Bildschirm. Das hatte jedoch zur Folge, dass die KI fasziniert auf die Animation von Wasser schaute und dort in der Nähe stehenblieb, statt weiter zur nächsten Stadt zu laufen.

Weitere Belohnungspunkte wurden eingeführt, etwa für das Fangen von Pokémon, das Gesamtlevel des Teams, den Gewinn eines Trainerkampfes oder den Sieg in einer Arena.

Doch auch danach kam es immer wieder zu Problemen.

Wer übrigens nostalgische Gefühle bei diesem Text und dem dazugehörigen Video bekommt, sollte sich den Trailer zur neuen Live-Action-Serie anschauen:

Video starten

Pokémon Live Action Serie Trailer

Die Angst vor Schwester Joy, die Suche nach der zweiten Arena und 10.000 Karpador

Welche Hürden gab es? Beim ersten Besuch im Pokémon Center interagierte die KI mit dem Computer und lagerte einige Pokémon ein. Das senkte das Gesamtlevel des Teams, was zu einer Art Trauma führte – auch wenn der Algorithmus natürlich keine Gefühle hat. Fortan wurde jedoch versucht, das Gebäude aktiv zu vermeiden.

Das führte dazu, dass das Team nicht mehr geheilt wurde. Whidden musste also am System herumschrauben und ein neues Belohnungslevel einführen.

Ebenfalls kurios waren Anpassungen bei den Kämpfen. So rannte die KI in jeden Kampf rein, ob sie gewinnen konnte oder nicht. Also führte der YouTuber eine Strafe für verlorene Kämpfe ein. Doch direkt bei der ersten Niederlage, weigerte sich die KI dann, den A-Knopf zu drücken, nachdem das letzte Pokémon gestorben war. Sie wollte einfach für immer im Kampf-Bildschirm verweilen, um keinen Punktabzug zu bekommen.

Auch der Kampf gegen Rocko in der ersten Arena lief alles andere als logisch ab. So begriff die KI lange nicht, dass Wasserattacken die Schwäche von Gesteins-Pokémon sind. Erst, als Schiggy keine anderen Fähigkeiten als Blubber mehr nutzen konnte, wurde dieser Angriff zum ersten Mal eingesetzt. Es folgte ein lockerer Sieg – nach rund 7.000 Spielstunden.

KI lernt Glitches, für die andere Jahrzehnte brauchen

War alles schlecht bei dem Experiment? Nein, denn der Algorithmus nutzte immer wieder an der gleichen Stelle einen bestimmten Laufweg, der auf den ersten Blick keinen Sinn ergab. Später fand der YouTuber aber heraus, dass ein Glitch genutzt wurde, der garantiert, dass das erste Pokémon, das man traf, sofort mit einem Wurf gefangen werden kann.

Das gesamte Video könnt ihr euch hier anschauen:

Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von YouTube, der den Artikel ergänzt.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum YouTube Inhalt

Was kam da überhaupt zum Einsatz? Am Ende des Videos erklärt der YouTuber noch viele technische Details, die besonders interessant sind, wenn man selbst solche Experimente durchführen möchte. So nutzte der für den Lern-Algorithmus die Proximal Policy Optimization, was laut ihm der Standard sei und auch für ChatGPT genutzt wurde.

Das Schwierigste bei dem Prozess ist, der Maschine zu erklären, was sie tun soll, ohne ihr jeden Schritt einzeln zu erklären, denn eigentlich soll die KI ja selbstständig lernen. Dabei helfen größere Datensätze, die hier bei Pokémon Rot jedoch nicht vorlagen, anders etwa als bei Text- oder Sprach-KIs.

Was sagt ihr zu diesem Experiment? Fandet ihr die Infos und das Video unterhaltsam?

Wie gut die Sprach-KIs inzwischen sind, zeigt dieses Beispiel: Firma entlässt ein ganzes Team, lässt die Arbeit jetzt von KI machen – Ein Mitarbeiter klagt: „Eine KI hat mir den Job weggenommen.“

Quelle(n):

Gamesradar

Deine Meinung ist uns wichtig!

Gefällt dir der Artikel? Hast du irgendwelche Kommentare? Sag uns, was du denkst!

Kommentieren

Kommentare

Bitte lies unsere Kommentarregeln, bevor du kommentierst.

6 Kommentare

Neueste

Älteste Meisten Abstimmungen

Ach Nee(@ach-nee)

vor 2 Jahren

#1188009

Was wir hier vorgelegt bekommen haben ist weniger ein Beweis dafür, wie “doof” ein Algorithmus ist, der “eigenständig” Entscheidungen treffen soll, sondern es zeigt eher eindrucksvoll, wie schwierig es ist, Intuition und den Mut zum wiederholten Versuch mit leichten Abwadlungen nach dem Scheitern zu vermitteln. Daran ist der Trainer der KI letztlich “gescheitert”. Das soll seine Bemüungen keinerlei in Abrede stellen – ganz im Gegenteil – die Geduld, hier und da immer und immer wieder nachzuschärfen ist IMHO absolut beeindruckend!

GERD(@paranoidrgbg)

#1187923

Also

Firefix(@firefix)

#1187910

Das Programm ist halt nur so gut wie ihr Erschaffer.

Alexander Leitsch(@sputti)

Antwort an Firefix

#1187917

Das mag durchaus stimmen und ich bin mir sicher, jemand kann eine KI programmieren, die das deutlich besser macht. Aber das Problem ist halt, dass die KI es ja selbst lernen soll. Das ist ja der Punkt, der viele so nervös macht, wenn sie irgendwann schneller lernt als man es kontrollieren kann. Und das ist hier definitiv nicht der Fall 😀

Katsuno(@katsuno)

Antwort an Alexander Leitsch

#1187920

Ja entweder lernt sie selber und geht dabei einigermaßen eigene Wege , wenigsten etwas in Richtung Bewusstsein und Entscheidung.
aber solche sich selbst schreibenden , KI zu nennen ist halt auch irreführend ^^

viele stellen sich was anderes unter KIs vor, denke da gibt es einige Missverständnisse mit der allgemeinen Gesellschaft 😂

Zuletzt bearbeitet vor 2 Jahren von Katsuno

JahJah(@jahjah192)

#1188018

Naja gut aber wie du selbst sagst, es mag sicher andere geben die das erschreckend besser können.
also kann diese „schlechte“ KI ja auch nicht das Maß dazu sein da irgendwas zu beweisen 😉
die gescheite KI hätte den T-1000 ins Game geschleust und in 1Minute alle NPC bestialisch getötet…

	Beleidigung/Streit/Spam
	Copyright-Verletzungen
	Anstößige Inhalte (Bilder oder Text)
	Illegale Inhalte (Extremismus, Pornografie, Raubkopien)
	Sonstige Probleme

Künstliche Intelligenz soll Probleme der Menschheit lösen – Scheitert an Pokémon Rot, findet nach 50.000 Stunden die Arena nicht

Die Angst vor Schwester Joy, die Suche nach der zweiten Arena und 10.000 Karpador

KI lernt Glitches, für die andere Jahrzehnte brauchen

Deine Meinung ist uns wichtig!

Kommentare

Nach 49 Jahren hält der erste Star Wars noch immer einen Rekord, den wohl kein anderer Teil jemals brechen wird

Spieler in Diablo 4 sterben mysteriöse Tode, glauben nun, ein Ring ist daran Schuld – Blizzard ermittelt

Das neue Strategiespiel zu Warhammer 40.000 stellt Robo-Mumien vor, versteckt ein vernichtendes Detail vor aller Augen

Henry Cavill ist ein so großer Warhammer-Nerd, selbst sein Grill wurde vom Adeptus Mechanicus abgenommen

Entwickler hinter Battlefield-Konkurrent zocken ihr eigenes Spiel auf eine Weise, die ihr nicht zuhause nachmachen solltet