Wo geht’s zum Kühlschrank? Der gesunde Menschenverstand hilft Robotern beim Navigieren

Bildnachweis: CC0 Public Domain

Ein Roboter, der von Punkt A nach Punkt B fährt, ist effizienter, wenn er versteht, dass Punkt A die Couch im Wohnzimmer und Punkt B ein Kühlschrank ist, selbst wenn er sich an einem unbekannten Ort befindet. Das ist die vernünftige Idee hinter einem „semantischen“ Navigationssystem, das von der Carnegie Mellon University und Facebook AI Research (FAIR) entwickelt wurde.

Dieses Navigationssystem mit dem Namen SemExp gewann letzten Monat die Habitat ObjectNav Challenge während der virtuellen Computer Vision and Pattern Recognition-Konferenz und setzte sich damit gegen ein Team von Samsung Research China durch. Es war der zweite erste Platz in Folge für das CMU-Team bei der jährlichen Herausforderung.

SemExp, oder Goal-Oriented Semantic Exploration, nutzt maschinelles Lernen, um einen Roboter darauf zu trainieren, Objekte zu erkennen – indem er beispielsweise den Unterschied zwischen einem Küchentisch und einem Beistelltisch kennt – und zu verstehen, wo in einem Haus solche Objekte wahrscheinlich zu finden sind. Dies ermöglicht es dem System, strategisch darüber nachzudenken, wie es nach etwas suchen soll, sagte Devendra S. Chaplot, ein Ph.D. Student in der Abteilung für maschinelles Lernen der CMU.

„Der gesunde Menschenverstand sagt, wenn Sie nach einem Kühlschrank suchen, sollten Sie besser in die Küche gehen“, sagte Chaplot. Klassische Roboternavigationssysteme hingegen erkunden einen Raum, indem sie eine Karte mit Hindernissen erstellen. Der Roboter kommt schließlich dorthin, wo er hin muss, aber der Weg kann umständlich sein.

Frühere Versuche, maschinelles Lernen zum Trainieren semantischer Navigationssysteme zu verwenden, wurden behindert, weil sie dazu neigen, sich Objekte und ihre Standorte in bestimmten Umgebungen zu merken. Diese Umgebungen sind nicht nur komplex, sondern das System hat oft Schwierigkeiten, das Gelernte auf verschiedene Umgebungen zu verallgemeinern.

Forscher der Carnegie Mellon University und Facebook AI Research haben ein Navigationssystem für Roboter entwickelt, das auf gesundem Menschenverstand basiert. Die Technik nutzt maschinelles Lernen, um Robotern beizubringen, Objekte zu erkennen und zu verstehen, wo sie sich wahrscheinlich im Haus befinden. Das Ergebnis ermöglicht es den Maschinen, strategischer zu suchen. Bildnachweis: Carnegie Mellon University

Chaplot hat dieses Problem in Zusammenarbeit mit Dhiraj Gandhi von FAIR, Abhinav Gupta, Associate Professor am Robotics Institute, und Ruslan Salakhutdinov, Professor am Machine Learning Department, umgangen, indem er SemExp zu einem modularen System gemacht hat.

Das System nutzt seine semantischen Erkenntnisse, um die besten Orte für die Suche nach einem bestimmten Objekt zu bestimmen, sagte Chaplot. “Sobald Sie sich entschieden haben, wohin Sie gehen möchten, können Sie einfach die klassische Planung verwenden, um dorthin zu gelangen.”

Dieser modulare Ansatz erweist sich in mehrfacher Hinsicht als effizient. Der Lernprozess kann sich auf Beziehungen zwischen Objekten und Raumlayouts konzentrieren, anstatt auch die Routenplanung zu lernen. Die semantische Argumentation bestimmt die effizienteste Suchstrategie. Schließlich bringt die klassische Navigationsplanung den Roboter so schnell wie möglich dorthin, wo er hin muss.

Die semantische Navigation wird es Menschen letztendlich erleichtern, mit Robotern zu interagieren, indem sie dem Roboter einfach sagen, dass er einen Gegenstand an einem bestimmten Ort holen soll, oder ihm Anweisungen wie „Geh zur zweiten Tür links“ geben können.


Leave a Comment