Humanoide Fußballroboter für die RoboCup KidSize-Liga
Final Report Abstract
Seit 1997 veranstaltet die RoboCup-Federation jährlich internationale Wettbewerbe im Roboterfußball, an denen sich eine große Zahl von Forschergruppen beteiligt. Durch die Schaffung einer Testumgebung lassen sich unterschiedliche Lösungsansätze bei der Konstruktion und Steuerung autonomer mobiler Roboter objektiv vergleichen. Roboterfußball hat sich seitdem zu einem Leitproblem der künstlichen Intelligenz-Forschung und der Robotik entwickelt. Seit 2004 beteiligt sich das Team Nimb-Ro des Antragstellers an den Wettbewerben der Humanoid-Liga. In dieser Liga stehen die Kontrolle der vielen Robotergelenke, um robuste Gang-, Schuss- und Aufstehbewegungen zu erzielen, die Wahrnehmung der Spielsituation mit bewegten Kameras und die Teamkoordination im Vordergrund. Im Projekt sind humanoide Fußballroboter entstanden, die seit 2007 das japanische Team Osaka als weltweit bestes Team in der RoboCup Humanoid-Liga abgelöst haben. In den Jahren 2005–2008 trafen unser Team NimbRo und Team Osaka viermal hintereinander im KidSize-Finale aufeinander. Während 2005 Team Osaka noch einen klaren Vorteil hatte, konnten sich die Japaner 2006 erst in der Verlängerung durchsetzen. In den Jahren 2007 und 2008 konnten dann die im Projekt entwickelten Roboter den Wettbewerb für sich entscheiden. Bei der Spielqualität setzten unsere Fußballroboter Maßstäbe. Im Gegensatz zu den meisten Teams bleiben die Roboter nicht zwischen Bewegungsmakros stehen, sondern bewegen sich flexibel durch kontinuierliches omnidirektionales Gehen. Sie erkennen Instabilitäten und lösen stabilisierende Schutzreflexe aus oder gehen kontrolliert zu Boden. Danach können sie zuverlässig wieder aufstehen. Die Roboter verfügen über elementare Fähigkeiten, wie verschiedene Schuss- und Torwartverhalten. Diese werden von komplexeren Fußballverhalten benutzt. Die Wahrnehmung der Spielsituation erfolgt über Kameras. Die Roboter sehen den Ball und andere Spieler und bestimmen ihre Position auf dem Spielfeld. Die Spieler eines Teams stimmen sich über die Rollenverteilung ab und tauschen sich über die Ballposition aus. Grundlage für die Erfolge im Wettbewerb bildeten technische Beiträge, die auf führenden internationalen Konferenzen und in Zeitschriften publiziert wurden. Bei der Entwicklung der Roboter gab es Innovationen, wie die Beweglichkeit im Rumpf, die Verwendung von zwei parallelen Aktuatoren in größeren Gelenken, die hohe Rechenleistung, die Drei-Kamera-Sichtsysteme und die gepolsterte Außenhülle. Im Bereich der Wahrnehmung haben wir insbesondere Beiträge zur probabilistischen Lokalisierung geleistet. Dazu wurden Tore, Torpfosten und Eckmarkierungen, sowie Ecken und Kreuzungen der Spielfeldlinien und der Mittelkreis detektiert. Mit Hilfe eines Partikelfilters wurden diese unsicheren, ungenauen und verrauschten Detektionen mit den zum Roboter geschickten Bewegungskommandos zu einer robusten Posenschätzung fusioniert. Im Bereich der Verhaltenssteuerung war ein wesentlicher Beitrag die Weiterentwicklung eines hierarchisch-reaktiven Ansatzes, der auf die Bedürfnisse der humanoiden Roboter angepasst wurde. Weiterhin haben wir im Projekt schnelle und robuste omnidirektionale Gangverhalten entwickelt, sowie parametrisierbare Schussverhalten, Torwart-Paraden und Aufsteh-Verhalten. Auch für die Rollenverteilung im Team über WLAN wurden Mechanismen entwickelt. Für eine Vielzahl von Komponenten unseres Systems wurden Lernverfahren entwickelt. Dafür war die physikalische Simulation der Roboter entscheidend. Wir haben beispielsweise Parameter des omnidirektionalen Gangs durch optimierendes Lernen verbessert. Weiterhin wurde ein geschwindigkeitsabhängiges Modell der Roboterbewegung beim Gehen gelernt, um Abweichungen von dem normalen Neigungsverlauf in einem Instabilitätsmaß aggregieren und – bei detektierter Instabilität – stabilisierende Reflexe auslösen zu können. Aus Motion-Capture-Daten wurde ein Modell der Roboterbewegung gelernt, das die Grundlage für die Planung einzelner Schritte bildet. Auch im Bereich der Wahrnehmung kamen Lernverfahren zum Einsatz. Für Verifikation von Ball-Hypothesen haben wir beispielsweise einen neuronalen Klassifikator entwickelt. Für die Entscheidung des Torwarts über Zeitpunkt und Art der Parade haben wir ein Modell der Ballbewegung bei Schüssen auf das Tor erlernt. Ein wesentliches Problem humanoider Fußballroboter ist immer noch die Stabilität des zweibeinigen Gangs. Während unsere Roboter relativ schnell und sicher auf zwei Beinen omnidirektional auf dem ebenen Spielfeld gehen können, bereitet die Wahrung der Balance bei Störungen, wie dem Anrempeln durch einen anderen Roboter oder das Treten auf den Fuß eines anderen Roboters, immer noch große Probleme. Mit unserem TeenSize-Roboter haben wir kürzlich einen Ansatz zur seitlichen Stabilisierung entwickelt, der auf einem Linear-Invertierten-Pendel beruht. Im Rahmen des SPP „Autonomes Lernen“ hat der Antragsteller ein Projekt beantragt, in dem unser Roboter autonom bessere Modelle seiner Dynamik lernen soll, um auch bei höheren Geschwindigkeiten und beliebigen Störungen die Balance beim Gang zu wahren. Eine weitere Stoßrichtung für künftige Forschungsarbeiten ist das Rennen. Die Möglichkeiten zur weiteren Geschwindigkeitssteigerung beim Gehen sind nicht mehr sehr groß, da die Roboter – bezogen auf ihre Körpergröße vom 60cm – fast schon menschliche Gehgeschwindigkeiten erreichen. Hierfür sind allerdings Aktuatoren erforderlich, die elastisch sind und hohe Spitzenleistungen liefern. Pneumatische und hydraulische Aktuatoren – in Kombination mit Federn – haben solche Eigenschaften, sind aber nicht einfach in einem autonomen mobilen Roboter einzusetzen. Eine Alternative wären möglicherweise leistungsstarke Elektromotoren mit Direktantrieb bzw. geringer Untersetzung, die über Federn an das Skelett angekoppelt sind. In der Arbeitsgruppe des Antragstellers laufen zurzeit erste Experimente mit Linearmotoren, die über eine Feder ein Teleskopbein antreiben. Ziel ist, einen kleinen rennenden Roboter zu entwickeln. Eine weitere, viel versprechende, Idee für zukünftige Forschungsarbeiten ist, den hierarchisch-reaktiven Ansatz zur Verhaltenssteuerung zu einem hierarchischen Planungsansatz auszubauen. Hierbei sollen Pläne auf verschiedenen Abstraktionsstufen, die unterschiedlich schnell laufen, geplant werden, sodass jede Stufe nur eine geringe, konstante Anzahl von Aktionen enthält. Diese Vorgehensweise führt zu Plänen, die in unmittelbarer Zukunft detailliert ausgestaltet sind und konkret abgearbeitet werden können. Je weiter diese Pläne in die Zukunft reichen, desto gröber und abstrakter werden die geplanten Aktionen. Durch kontinuierliche Aktualisierung der Pläne werden die abstrakten Aktionen in dem Maße konkretisiert, in dem die Zeit bis zu ihrer Ausführung schwindet. Die vorgeschlagene Vorgehensweise repräsentiert auch weit in die Zukunft reichende Pläne durch nur wenige Aktionen. So wird die Erstellung langer, detaillierter Pläne vermieden, welche die begrenzten Ressourcen der Bordrechner überfordern würde. Zu den ersten Schritten in diese Richtung gehört die vom Antragsteller vorgeschlagene lokale Multiresolutions-Pladplanung, die kürzlich auf Nao-Robotern implementiert und evaluiert wurde. Weiterhin wurde in der Arbeitsgruppe des Antragstellers eine Diplomarbeit zum Thema „Hierarchische Schrittplanung für humanoide Fußballroboter“ abgegeben, in der das Ziel verfolgt wurde, beim Anlauf den Ball in der richtigen Schrittphase zu treffen, ohne vorher die Geschwindigkeit verringern zu müssen. Humanoide Fußballroboter sind nicht nützlich. Trotzdem wurden in den letzten Jahren zwei kommerzielle Roboter (Aldebaran Nao und DARwIn-OP) für den Forschungsmarkt entwickelt. Bei den humanoiden Fußballrobotern handelt es sich um komplexe technische Systeme, die noch weit davon entfernt sind, für den Massenmarkt geeignet zu sein. Gründe sind neben den Kosten vor allem die Kalibrierung von Bildverarbeitung und Gelenken, die Expertenwissen erfordern, und die fehlende Robustheit bei Stürzen, die die Lebensdauer der Roboter begrenzen. Wenn die Probleme bei Kalibrierung und Robustheit gelöst werden können, sieht der Antragsteller das Potential, mit den humanoiden Fußballrobotern breitere Märkte, wie den Edutainment-Markt, zu erschließen. Es ist dabei zu erwarten, dass mit höheren Stückzahlen die Roboter auch kostengünstiger gefertigt werden können. Längerfristig können die bei den Fußballrobotern gewonnen Erkenntnisse zur robusten Fortbewegung auf zwei Beinen auch bei humanoiden Robotern Anwendung finden, die sich in unseren Alltagsumgebungen nützlich machen.
Publications
- Instability Detection and Fall Avoidance for a Humanoid using Attitude Sensors and Reflexes. In: Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Beijing, pp. 2967–2973, 2006. IROS Best RoboCup Paper Award
Reimund Renner and Sven Behnke
- Online Trajectory Generation for Omnidirectional Biped Walking. In: Proceedings of IEEE International Conference on Robotics and Automation (ICRA), pp. 1597–1603, Orlando, FL, 2006
Sven Behnke
- Playing Soccer with Humanoid Robots. KI – Zeitschrift Künstliche Intelligenz, vol. 3, pp. 51–65, 2006
Sven Behnke
- See, walk, and kick: Humanoid robots start to play soccer. In: Proceedings of IEEE-RAS International Conference on Humanoid Robots (Humanoids), Genova, Italy, pp. 497–503, 2006
Sven Behnke, Michael Schreiber, Jörg Stückler, Reimund Renner, and Hauke Strasdat
- Stochastic Optimization of Bipedal Walking using Gyro Feedback and Phase Resetting. In: Proceedings of IEEE-RAS International Conference on Humanoid Robots (Humanoids), Pittsburgh, USA, 2007
Felix Faber and Sven Behnke
- Hierarchical Reactive Control for Humanoid Soccer Robots. International Journal of Humanoid Robots (IJHR), 5(3): 375–396, 2008
Sven Behnke and Jörg Stückler
- Utilizing the Structure of Field Lines for Efficient Soccer Robot Localization. In: Proceedings of 14th International RoboCup Symposium, Singapore, 2010
Hannes Schulz, Weichao Liu, Jörg Stückler and Sven Behnke