Waymo verbessert autonome Fahrzeuge mit DeepMind
Kredit: Waymo
Waymo, ein Unternehmen für autonome Fahrzeuge von Alphabet Inc., arbeitet mit DeepMind zusammen, um eine neue Methode zum Trainieren von KI zu entwickeln, die von der Art und Weise inspiriert ist, wie sich die Biologie entwickelt
Über 120 Arten sind nach Charles Darwin benannt. Die Wirkung, die der Naturforscher, Geologe und Biologe auf Wissenschaft und Natur hatte, ist vielleicht beispiellos in der Geschichte der Menschheit. Auch heute noch inspiriert sein beträchtlicher Einfluss die Technologiewelt.
In einer Forschungskooperation mit DeepMind hat Waymo der Welt mitgeteilt, dass die beiden Organisationen von darwinistischen Theorien lernen, um ihr KI-Training effizienter zu gestalten. Indem die schwächsten Aspekte ihres Trainings eliminiert werden, arbeiten die selbstfahrenden Algorithmen von Waymo im Wesentlichen nach einer „Survival of the Fittest“-Formel.
DeepMind behauptet, dass durch den Einsatz von Population-Based Training (PBT) die Zahl falsch-positiver Ergebnisse um 24 % zurückgegangen ist. Dies führte zu einer Einsparung von 50 % sowohl der Schulungszeit als auch der Ressourcen im Vergleich zu den Standardmethoden, die Waymo zuvor angewendet hat.
Dies könnte ein Durchbruch in der fahrerlosen Technologie sein. Die Sensoren, die in einem automatisierten Fahrzeug verwendet werden, sind mehr als bereit für den öffentlichen Gebrauch, nur die Intelligenz ist nicht ganz auf dem Niveau, das für autonome Fahrzeuge erforderlich ist wirklich selbst fahren.
Wird die jüngste Zusammenarbeit von Waymo und DeepMind den Zündschlüssel für autonome Technologie überall umdrehen?
Was ist PBT?
Populationsbasiertes Training (PBT) wurde von Deepmind entwickelt, um effizientere Wege für das Training zu finden neuronale Netze.
PBT startet viele Hyperparameter-Suchen auf einmal. Hyperparameter sind einfach Parameter mit Werten, die zur Steuerung des Lernens verwendet werden; PBT vergleicht und konkurriert Modelle miteinander, wobei verlorene Modelle aus dem Trainingspool entfernt werden.
In der Metapher der Evolution handelt es sich um ein Naturphänomen. Tiere konkurrieren beispielsweise um Nahrung oder Unterkunft, wobei nur noch die stärksten, klügsten und letztendlich erfahrensten Mitglieder einer Art zur Fortpflanzung übrig bleiben. Das Muster setzt sich mit der nächsten Generation fort. PBT ist äußerst ähnlich, da „leicht mutierte“ Hyperparameter bestehen bleiben. Hyperparameter werden während des Trainings aktiv aktualisiert.
PBT ist eine effiziente Methode des maschinellen Lernens, da es nur mit erfolgreichen Hyperparameterwerten trainiert.
Wie sahen die Experimente von Waymo und DeepMind aus?
DeepMind und Waymo trainierten zunächst ein Netzwerk, das eine Box um Straßenhindernisse herum erzeugt. Dies wird als „Regional Proposal Network“ bezeichnet.
Das Ziel war zu sehen, ob ein PBT die Fähigkeit eines neuronalen Netzes zur Identifizierung von Fußgängern und Radfahrern verbessern könnte, indem die schwächeren Modelle im Satz eliminiert werden. Das PBT plante, Hindernisse durch Erinnerung und Präzision zu finden: im Wesentlichen durch die Identifizierung und Eliminierung falsch positiver Ergebnisse.
„Das Ziel dieses Experiments war es, dieses einzelne neuronale Netz so zu trainieren, dass es die Erinnerung über 99 % aufrechterhält und gleichzeitig die Fehlalarme mithilfe von populationsbasiertem Training reduziert“, so Waymo Blog-Post lesen.
In diesen Experimenten konnten wir die Diversität erhöhen, indem wir Subpopulationen namens „Nischen“ schufen, in denen neuronale Netze nur innerhalb ihrer eigenen Untergruppen konkurrieren durften - ähnlich wie sich Arten entwickeln, wenn sie auf Inseln isoliert werden. Wir haben auch versucht, Vielfalt direkt durch eine Technik namens „Fitness-Sharing“ zu belohnen, bei der wir den Unterschied zwischen Mitgliedern der Bevölkerung messen und einzigartigeren neuronalen Netzen einen Wettbewerbsvorteil verschaffen. Eine größere Diversität ermöglicht es PBT, einen größeren Hyperparameterraum zu erkunden.
Waymo
Das Experiment hatte einige interessante Ergebnisse. Waymo fand heraus, dass sie Netzwerke evaluieren mussten, um herauszufinden, ob sie ihre Kapazität in der realen Welt erfüllen würden; schließlich müssen neuronale Netze in der Lage sein, auf ihre Umgebung zu reagieren, anstatt nur gelernte Informationen abzurufen.
Waymo trennte PBT-Wettkampfsätze von Trainingssätzen, bevor er die endgültige Leistung mit einem Bewertungssatz verifizierte, den die neuronalen Netze noch nie im Training oder Wettkampf gesehen haben. Betrachten Sie es als Training für Ihre Fahrprüfung: Ihre Erfahrungen stammen nicht nur aus dem Lesen der Straßenverkehrsordnung, sondern aus der Praxis, die Sie in Fahrstunden und anderen Fahrprüfungen gesammelt haben, falls Sie zuvor durchgefallen sind. Dies bildet Ihre endgültige Leistung auf die gleiche Weise wie diese Wettkampf- und Trainingssätze.
Auch Waymo setzte auf die Rechenzentren von Google. Die eingesetzten PBT-Modelle wurden alle 15 Minuten evaluiert, um die Schwachstellen hunderter Maschinen auszusortieren.
Was hat Waymo entdeckt?
Es wurde festgestellt, dass PBT viel Zeit und Mühe spart, da die Modelle ständig gegeneinander antreten. Darüber hinaus verwendet PBT die Hälfte der Rechenressourcen, die von der zufälligen parallelen Suche verwendet werden.
PBT wird jetzt von einer Vielzahl weiterer Waymo-Fahrzeuge verwendet. Man hofft, dass diese Effizienz- und Evolutionstaktik dazu beitragen wird, noch schneller bessere, effizientere fahrerlose Autos zu bauen.
Evolution inspiriert weiter. Wer weiß, wohin sich die Welt der autonomen Fahrzeuge in den nächsten Jahren entwickeln wird?