AlphaGo Zero: die intelligenteste autodidaktische KI

AlphaGo Zero: die intelligenteste autodidaktische KI

KI ist oft auf große Datensätze angewiesen, die von Menschen bereitgestellt werden, um einen Algorithmus zu lernen. AlphaGo Zero hat sich jedoch erfolgreich selbst beigebracht.

Googles neueste künstliche Intelligenz, AutoML, kann sich jetzt besser selbst programmieren als ihre menschlichen Pendants, nachdem sie sich selbst grundlegende Programmierkenntnisse beigebracht hat. Googles andere aktuelle und erfolgreiche KI war AlphaGo. Vor einem Jahr schlug AlphaGo den weltbesten Go-Spieler, aber diese KI wurde jetzt jedes Mal von ihrem neuesten Update, dem AlphaGo Zero, geschlagen.


„Wir haben tatsächlich die Beschränkungen des menschlichen Wissens beseitigt“


Diese Entwicklung verändert das Spiel für künstliche Intelligenz, denn in einer selbstlernenden Dynamik gibt es keine Chance, dass sich menschliche Fehler auf die KI übertragen. Ein fehlerhafter menschlicher Eingabedatensatz kann zu fehlerhaften KI-Algorithmen führen, aber wenn die KI den Algorithmus vollständig selbst entwickelt, gibt es keinen Platz für Fehler.

AlphaGo Zero bläst seinen Vorgänger aus dem Wasser

Vor etwas mehr als einem Jahr schlug AlphaGo AI zum ersten Mal den 18-fachen koreanischen Go-Weltmeister und überraschte die Welt mit seiner Fähigkeit. Jetzt hat AlphaGo Zero seinen Vorgänger aus dem Wasser gesprengt.

Das alte Brettspiel Go mag für eine KI wie eine triviale Aufgabe erscheinen, aber es ist möglich, dass 10,170 Züge bedeuten, dass es viele komplizierte Informationen gibt, um das Spiel zu spielen und einen Algorithmus zu erstellen, um dies perfekt zu machen. Aus diesem Grund hat AlphaGo Zero das Potenzial, mit anderen Daten wie Teilchenphysik, Quantenchemie oder Arzneimittelforschung zu arbeiten.

AlphaGo Zero ist auch effizienter; Das vorherige AlphaGo verwendete 48 TPUs (KI-Prozessoren, die von Google gebaut wurden), während diese neue Version nur vier verwendet. Deepmind-Mitbegründer Demis Hassabis hat erklärt, dass AlphaGo als sehr gute Maschine zum Durchsuchen komplizierter Daten angesehen werden kann, AlphaGo Zero jedoch die Möglichkeit hat, für weitaus mehr Potenzial umprogrammiert zu werden.

Wie funktioniert AlphaGo Zero?

AlphaGo Zero wird sein eigener Lehrer. Dies geschieht durch eine Form des Verstärkungslernens, beginnend mit einem leeren neuronalen Netzwerk. Es spielt das Spiel Go gegen sich selbst und kombiniert dieses neuronale Netzwerk mit einem Suchalgorithmus. Das neuronale Netzwerk lernt dann, Bewegungen vorherzusagen.

Dieses aktualisierte neuronale Netzwerk rekombiniert sich selbst mit dem Suchalgorithmus. Der Vorgang wiederholt sich, da AlphaGo Zero mit jedem gespielten Spiel mehr lernt. Die Qualität der Self-Play-Spiele verbessert sich: Durch ständiges Üben wird das neuronale Netzwerk von AlphaGo Zero immer raffinierter und erweitert sein Wissen, indem es von sich selbst lernt. Da AlphaGo Zero der stärkste Go-Spieler der Welt ist, gibt es niemanden, von dem man besser lernen könnte.

Frühere Versionen von AlphaGo verwendeten ein „Richtliniennetzwerk“, um den nächsten Spielzug auszuwählen, während ein „Wertenetzwerk“ den Gewinner vorhersagte. Es gibt nur ein neuronales Netzwerk in AlphaGo Zero, was bedeutet, dass es sich selbst effizienter trainieren kann.

Bild aus http://deepmind.com/

Bekki Barnes

Mit 5 Jahren Erfahrung im Marketing verfügt Bekki über Kenntnisse sowohl im B2B- als auch im B2C-Marketing. Bekki hat mit einer Vielzahl von Marken zusammengearbeitet, darunter lokale und nationale Organisationen.

Erzielen Sie Produktivitäts- und Effizienzsteigerungen durch Datenmanagement

Russ Kennedy • 04. Juli 2023

Unternehmensdaten sind seit vielen Jahren eng mit Hardware verknüpft, doch jetzt ist ein spannender Wandel im Gange, da die Ära der Hardware-Unternehmen vorbei ist. Mit fortschrittlichen Datendiensten, die über die Cloud verfügbar sind, können Unternehmen auf Investitionen in Hardware verzichten und das Infrastrukturmanagement zugunsten des Datenmanagements aufgeben.