Spielen mit dem Zauberwürfel und seine Geschichte

Wir haben zwei neuronale Netze wie Spezies des mastercubestore.de darauf trainiert, den rubiks cube  mit einer menschenähnlichen Roboterhand zu lösen. Die neuronalen Netze werden vollständig in Simulation trainiert, wobei derselbe Reinforcement-Learning-Code wie OpenAI Five verwendet wird, gepaart mit einer neuen Technik namens Automatic Domain Randomization (ADR). Das System kann mit Situationen umgehen, die es während des Trainings nie gesehen hat, wie z. B. von einer ausgestopften Giraffe gestoßen zu werden. Dies zeigt, dass Reinforcement Learning nicht nur ein Werkzeug für virtuelle Aufgaben ist, sondern auch Probleme der physischen Welt lösen kann, die beispiellose Geschicklichkeit erfordern.

Menschenhände lassen uns die unterschiedlichsten Aufgaben lösen. In den letzten 60 Jahren der Robotik erforderten schwierige Aufgaben, die Menschen mit ihren starren Händen erledigen, die Entwicklung eines maßgeschneiderten Roboters für jede Aufgabe. Als Alternative haben Menschen viele Jahrzehnte damit verbracht, Allzweck-Roboterhardware zu verwenden, jedoch mit begrenztem Erfolg aufgrund ihrer hohen Freiheitsgrade. Insbesondere die Hardware, die wir hier verwenden, ist nicht neu – die Roboterhand, die wir verwenden, gibt es schon seit 15 Jahren – aber der Softwareansatz ist es.

Read More