Ein Forschungsteam aus China hat den Humanoiden Unitree G1 erfolgreich darauf trainiert, Tennis zu spielen. Der Roboter kann nun mit menschlichen Partnern Ballwechsel über mehrere Schläge aufrechterhalten und dabei Bälle mit Geschwindigkeiten von über 15 Metern pro Sekunde zurückschlagen. Diese Entwicklung markiert einen wichtigen Schritt für humanoide Roboter im Bereich des dynamischen Sports.
Wichtige Erkenntnisse
- Der Unitree G1 Roboter kann Tennisbälle mit über 15 m/s Geschwindigkeit zurückschlagen.
- Das LATENT-Framework nutzt unvollständige Bewegungsdaten für das Training.
- Ein „Latent Action Barrier“ sorgt für natürliche Bewegungen des Roboters.
- Die Handgelenkskorrektur ist entscheidend für die Schlagpräzision.
- Die Übertragung von Simulation in die Realität erfolgte mittels Domain Randomization.
Revolution im Robotersport: Tennis mit dem Unitree G1
Humanoide Roboter entwickeln sich immer mehr von vorprogrammierten Abläufen zu dynamischen, reaktionsfähigen Athleten. Während frühere Demonstrationen wie der Unitree Robotics OmniXtreme extreme Balance und Akrobatik zeigten, stellt Tennis einzigartige Herausforderungen. Dazu gehören Sprints mit über 6 Metern pro Sekunde, Reaktionen auf Bälle, die mit 15 bis 30 Metern pro Sekunde fliegen, und das Schlagen des Balls mit Millisekundenpräzision.
Ein gemeinsames Team der Tsinghua-Universität, der Peking-Universität und Galbot Inc. hat das LATENT-Framework (Learns Athletic humanoid Tennis skills from imperfect human motion data) entwickelt, um diese Lücke zu schließen. Dieses System wurde auf dem 29-DoF Unitree G1 implementiert. Es ermöglicht dem Roboter, Ballwechsel mit menschlichen Spielern über mehrere Schläge hinweg aufrechtzuerhalten und seine Haltung sowie seinen Schwung an verschiedene Ballflugbahnen anzupassen.
Faktencheck
- Ballgeschwindigkeit: Der Unitree G1 kann Bälle mit einer Spitzengeschwindigkeit von über 15 m/s zurückschlagen.
- Sprinting: Roboter müssen im Tennis über 6 m/s sprinten können.
- DOF: Der Unitree G1 verfügt über 29 Freiheitsgrade (Degrees of Freedom).
Lernen aus unvollständigen Daten
Eine große Hürde im Robotersport ist der Mangel an hochwertigen Trainingsdaten. Das Sammeln präziser Motion-Capture-Daten eines vollständigen Tennisspiels ist technisch schwierig und teuer. Das LATENT-Framework umgeht dieses Problem. Es lernt aus „unvollkommenen“ Bewegungsfragmenten. Dazu gehören primitive Fähigkeiten wie Vorhandschläge, Rückhandschläge und Crossover-Schritte, anstatt vollständiger, realistischer Spielsequenzen.
Durch die Konzentration auf diese Grundfertigkeiten reduzierten die Forscher den erforderlichen Motion-Capture-Bereich um mehr als das 17-fache im Vergleich zu einem vollständigen Spielfeld. Dieser Ansatz nutzt das Vorwissen menschlicher Bewegungen. Gleichzeitig wird anerkannt, dass die Daten sowohl unvollständig (es fehlt der Spielkontext) als auch unpräzise sind (es fehlt die feine Handgelenkskontrolle).
Die Rolle des Latent Action Barrier (LAB)
Um diese Fragmente in eine kohärente Strategie zu übersetzen, entwickelten die Forscher einen hierarchischen Controller mit einem latenten Aktionsraum. Dies ähnelt der Architektur anderer „System 1“-Controller, die eine schnelle, reaktionsfähige Schicht für Ganzkörperfähigkeiten bereitstellen. Ohne Einschränkungen könnte eine übergeordnete Strategie jedoch den latenten Raum „ausnutzen“, was zu ruckartigen oder unnatürlichen Bewegungen führen würde.
LATENT löst dies durch die Einführung eines Latent Action Barrier (LAB). Der LAB schränkt die Erkundung des Roboters während des Reinforcement Learning (RL) ein. Er verwendet eine Mahalanobis-Distanz-basierte Barriere, um Aktionen innerhalb einer Verteilung zu halten, die natürlichen menschlichen Bewegungen ähnelt. Dies stellt sicher, dass der Roboter auch beim Sprinten zur Abfangen eines Hochgeschwindigkeitsballs „Bewegungsnatürlichkeit“ beibehält.
„Die Einführung des Latent Action Barrier war entscheidend, um flüssige und natürliche Bewegungsabläufe zu gewährleisten, selbst bei schnellen Reaktionen auf den Ball.“
Präzision und der Sprung von Simulation zur Realität
Da die Übertragung von menschlichen auf humanoide Bewegungen oft zu ungenauen Handgelenkspositionen führt, verwendet die LATENT-Strategie eine hybride Steuerungsstrategie. Der übergeordnete Planer gibt gleichzeitig latente Körperaktionen und direkte „korrigierende“ Befehle für das rechte Handgelenk aus. Dieser Ansatz des Restlernens ähnelt dem von Amazon's ResMimic, das eine Korrekturstrategie über die allgemeine Bewegungsverfolgung legt, um präzise Objektmanipulationen zu ermöglichen.
Hintergrund: Sim-to-Real Transfer
Der Übergang von der Simulation in die reale Welt ist eine der größten Herausforderungen in der Robotik. Forscher nutzen oft Domain Randomization, um die Roboter in einer Vielzahl von simulierten Umgebungen zu trainieren, die die Unsicherheiten und Variationen der realen Welt widerspiegeln. Dies ermöglicht einen sogenannten Zero-Shot Transfer, bei dem der Roboter ohne weitere Anpassung in der realen Welt funktioniert.
Die Übertragung von der Simulation in die reale Welt wurde durch aggressive Domain Randomization erreicht. Das Team randomisierte die Roboterkörpermasse, die Gelenkreibung und die Ballphysik, wie Luftwiderstand und Rückprall. Um die Latenz in der realen Welt zu bewältigen, verwendet das System ein gleitendes Vier-Frame-Fenster, um die Ballgeschwindigkeit genau abzuschätzen. Diese robuste Pipeline ermöglichte einen Zero-Shot Transfer, eine Leistung, die kürzlich auch im PHP-Parkour-Framework von Amazon hervorgehoben wurde.
Leistung in der Praxis
Im realen Einsatz zeigte der 16.000 US-Dollar teure Unitree G1 eine beeindruckende Schlagvielfalt. Der Roboter schlug erfolgreich Bälle mit Spitzengeschwindigkeiten von über 15 Metern pro Sekunde zurück und nutzte dabei verschiedene Schlagarten in unterschiedlichen Gerichtsbereichen.
Experimentelle Ergebnisse zeigten, dass die Einbeziehung des Latent Action Barrier und der Handgelenkskorrektur entscheidend war. Ohne Handgelenkskorrektur sanken die Erfolgsquoten erheblich, während das Entfernen des LAB zu suboptimalen, ruckartigen Sequenzen führte.
- Erfolgsrate: Deutlich höher mit Handgelenkskorrektur und LAB.
- Bewegungsqualität: Flüssiger und natürlicher dank LAB.
- Kosten des Roboters: Der Unitree G1 kostet etwa 16.000 US-Dollar.
Obwohl das aktuelle System auf ein externes optisches Motion-Capture-System zur globalen Zustandsschätzung angewiesen ist, schlagen die Forscher vor, dass zukünftige Iterationen aktive Vision oder Multi-Agenten-Training integrieren könnten, um eine Leistung zu erreichen, die mit der von professionellen menschlichen Spielern vergleichbar ist. Vorläufig dient LATENT als eindrucksvolle Demonstration, wie Humanoide komplexe, hochdynamische Aufgaben meistern können, selbst wenn die verfügbaren Trainingsdaten alles andere als perfekt sind.
Zukünftige Aussichten
Die Forschungsgruppe plant, die Technologie weiterzuentwickeln. Ein Ziel ist es, den Roboter von externen Kamerasystemen unabhängiger zu machen. Dies könnte durch die Integration von Sensoren direkt in den Roboter und den Einsatz von künstlicher Intelligenz für die visuelle Ballerkennung geschehen. Langfristig könnten solche Roboter nicht nur im Sport, sondern auch in anderen Bereichen eingesetzt werden, die schnelle Reaktionen und präzise Bewegungen erfordern.
Die Fähigkeit, von unvollständigen Daten zu lernen und diese in flüssige, natürliche Bewegungen umzusetzen, ist ein Durchbruch. Sie öffnet Türen für eine Vielzahl von Anwendungen, bei denen Roboter in dynamischen und unvorhersehbaren Umgebungen agieren müssen. Der Unitree G1 als Tennisspieler ist ein spannender Vorgeschmack auf das, was noch kommen wird.





