Generalist AI hat sein neues Robotermodell GEN-1 vorgestellt, das einen bedeutenden Fortschritt in der Automatisierung physischer Aufgaben darstellt. Das Unternehmen meldet eine Erfolgsquote von 99 Prozent bei einfachen physischen Tätigkeiten und eine dreimal höhere Geschwindigkeit im Vergleich zu aktuellen Systemen. Die Anpassung an neue Aufgaben und Robotertypen soll nur eine Stunde spezifischer Daten erfordern.
Wichtige Erkenntnisse
- GEN-1 erreicht 99% Erfolgsquote bei einfachen Aufgaben.
- Das Modell ist dreimal schneller als bisherige Systeme.
- Anpassung an neue Aufgaben benötigt nur eine Stunde Robotikdaten.
- Der Ansatz basiert auf einem riesigen Datensatz menschlicher Interaktionen.
- Roboter zeigen "intelligente Improvisation" bei unerwarteten Situationen.
Ein Meilenstein in der Robotikentwicklung
Nur fünf Monate nach der Einführung von GEN-0 präsentiert Generalist AI nun GEN-1. Dieses Modell ist nicht mehr nur ein Forschungsprototyp, sondern laut Unternehmen kommerziell einsatzfähig. Die Zuverlässigkeit und Geschwindigkeit bei der Bewältigung einfacher physischer Aufgaben sind bemerkenswert.
Die Vorgängerversion erreichte eine Erfolgsquote von 64 Prozent. GEN-1 übertrifft dies mit beeindruckenden 99 Prozent. Gleichzeitig erledigt es diese Aufgaben etwa dreimal schneller als der aktuelle Stand der Technik. Ein entscheidender Faktor ist die Effizienz der Anpassung: Für eine neue Aufgabe oder einen neuen Robotertyp benötigt das Modell lediglich eine Stunde spezifischer Roboterdaten.
Faktencheck
- Erfolgsrate: GEN-1 erzielt eine Erfolgsquote von 99% bei einfachen physischen Aufgaben.
- Geschwindigkeit: Das Modell ist etwa dreimal schneller als vergleichbare Systeme.
- Datenbedarf: Nur 1 Stunde roboterspezifische Daten für neue Aufgaben.
Was "Meisterschaft" in der physischen Welt bedeutet
Generalist AI definiert "Meisterschaft" in der Robotik durch drei Kernbereiche: Zuverlässigkeit, Geschwindigkeit und intelligente Improvisation. Pete Florence, CEO des Unternehmens, betont die Fähigkeit der Roboter, über Stunden hinweg Aufgaben ohne menschliches Eingreifen zu bewältigen.
In Langzeittests zeigte GEN-1 beeindruckende Leistungen:
- 200-maliges Falten von Kartons hintereinander.
- Über 200-maliger Service an Roboterstaubsaugern.
- Über 1.800-maliges Verpacken von Blöcken.
Während Industrieroboter seit Jahrzehnten repetitive Bewegungen ausführen, tun sie dies meist in streng kontrollierten Umgebungen. GEN-1 hingegen operiert in unstrukturierten Umgebungen. Dort muss es in Echtzeit auf unterschiedliche Bedingungen reagieren. Dies wird durch das sogenannte „physikalische Urteilsvermögen“ ermöglicht, wie Generalist-Mitbegründer Andy Zeng es beschreibt. Es handelt sich um eine reaktive Intuition für Kräfte und Reibung, die es der Maschine erlaubt, sich mitten in einer Aktion anzupassen.
„Was jetzt in der Robotik passiert, ist vergleichbar mit dem Moment, als Menschen GPT-3 öffneten und es baten, ein völlig neues Limerick zu schreiben“, sagte Pete Florence von Generalist AI. „Das Limerick existierte vorher nicht. Um das zu erreichen, braucht man ein improvisatorisches Intelligenzniveau.“
Der Vorteil der "Datenhände"
Das Geheimnis hinter GEN-1 liegt in der massiven Erweiterung des proprietären Datensatzes von Generalist AI. Dieser ist von 270.000 Stunden im November auf über 500.000 Stunden hochpräziser physischer Interaktionsdaten angewachsen. Um den Datenengpass in der Branche zu umgehen, nutzt Generalist AI kostengünstige, tragbare "Datenhände". Dies sind zangenartige Geräte, sogenannte UMIs, die von Menschen getragen werden.
Diese Methode ermöglicht es, menschliche Reflexe und "Mikrokorrekturen" viel effizienter zu erfassen als herkömmliche Teleoperationssysteme, die oft unter Latenz leiden. Der grundlegende GEN-1 Modell wird vollständig mit diesen menschlichen Daten vortrainiert. Erst in der letzten Stunde der aufgabenspezifischen Anpassung kommt es mit der eigentlichen Roboterhardware in Kontakt. Dieser Ansatz unterscheidet sich deutlich von Wettbewerbern wie Physical Intelligence (Pi), die eine Mischung aus Nachahmung und autonomem Reinforcement Learning in simulierten Umgebungen nutzen.
Hintergrundinformationen
Die Entwicklung von Robotern, die in unstrukturierten Umgebungen agieren können, ist ein zentrales Ziel der modernen Robotik. Traditionelle Industrieroboter sind oft für spezifische, wiederholende Aufgaben in kontrollierten Fabrikumgebungen konzipiert. Die Fähigkeit zur Anpassung und Improvisation in realen, dynamischen Szenarien stellt einen großen Schritt dar, um Roboter für eine breitere Palette von Anwendungen, wie etwa in der Logistik oder im Dienstleistungssektor, nutzbar zu machen.
Emergente Improvisation und der "Limerick"-Moment
Einer der faszinierendsten Aspekte der GEN-1 Ankündigung ist die Dokumentation von "emergenten Verhaltensweisen". Dies sind Handlungen, für die der Roboter nie explizit trainiert wurde. In einem Fall, als ein Plüschtier beim Einpacken in eine Tasche hängenblieb, nutzte der Roboter autonom seinen zweiten Arm, um die Tasche zu schütteln. Dadurch konnte das Spielzeug nach unten rutschen.
Diese Improvisationsfähigkeit erlaubt es GEN-1, über das Moravec-Paradoxon hinauszugehen. Dieses besagt, dass grundlegende physische Geschicklichkeit rechnerisch aufwendig ist. Durch die Skalierung auf größere Parameterzahlen – voraussichtlich über die von Generalist AI zuvor als "Phasenübergangspunkt" identifizierte 7-Milliarden-Parameter-Schwelle hinaus – beginnt das Modell, physikalische Gesetze zu verinnerlichen, anstatt nur Trajektorien nachzuahmen.
Wichtige Metrik
Generalist AI identifizierte zuvor eine 7-Milliarden-Parameter-Schwelle als "Phasenübergangspunkt" für robotische Intelligenz. GEN-1 überschreitet diese Schwelle.
Wettbewerbslandschaft: Skalierung versus Architektur
Die Veröffentlichung von GEN-1 fällt in eine Zeit beispielloser Investitionen in den Robotiksektor. Während Pi Berichten zufolge 1 Milliarde Dollar aufbringt, um eine universelle "Intelligenzschicht" für Hardware von Drittanbietern zu entwickeln, setzt Generalist AI auf rohe physische Interaktionsdaten.
Nicht jeder ist jedoch davon überzeugt, dass "Skalierung alles ist, was man braucht". Kritiker wie Brad Porter, CEO von Cobot, argumentieren, dass das "Brute-Forcing" von Daten gegen unvollkommene Architekturen "wirklich teuer ist und nicht unbedingt das gewünschte Ergebnis liefert." Dies spiegelt auch die jüngste Skepsis von Yann LeCun von AMI Labs wider, der weiterhin behauptet, dass Weltmodelle durch Beobachtung und nicht nur durch Aktions-Token-Vorhersage lernen müssen.
Generalist AI räumt ein, dass GEN-1 "weit davon entfernt ist, perfekt zu sein". Dieselben emergenten Verhaltensweisen, die einem Roboter helfen, sich von einem Fehler zu erholen, können auch zu unbeabsichtigten physischen Folgen führen. Das Unternehmen konzentriert sich nun auf die "Ausrichtung verkörperter Intelligenz" – die Entwicklung von Methoden, um diese zunehmend leistungsfähigen "Gehirne" so zu steuern, dass ihre Improvisationen hilfreich und sicher bleiben.
GEN-1 ist ab heute für die Early-Access-Partner von Generalist AI verfügbar. Dies signalisiert den Beginn eines hochriskanten Wettlaufs, um zu sehen, ob diese Modelle endlich das Labor verlassen und in die Arbeitswelt eintreten können.
- Zuverlässigkeit: Hohe Erfolgsquoten bei wiederholten Aufgaben.
- Geschwindigkeit: Effiziente und schnelle Ausführung.
- Anpassungsfähigkeit: Schnelles Lernen neuer Aufgaben.
- Improvisation: Umgang mit unerwarteten Situationen.
Die Zukunft der Robotik könnte stark von der Fähigkeit solcher Modelle abhängen, sich nahtlos in komplexe, dynamische Umgebungen zu integrieren und dabei sowohl effizient als auch sicher zu operieren. Die Fortschritte von Generalist AI mit GEN-1 sind ein vielversprechender Schritt in diese Richtung.





