Automatische Übersetzung anzeigen
Dies ist eine automatisch generierte Übersetzung. Wenn Sie auf den englischen Originaltext zugreifen möchten, klicken Sie hier
#Produkttrends
{{{sourceTextContent.title}}}
Forscher starten 26K+ Objektdatensatz, um Robotern zu helfen, Formen zu lernen
{{{sourceTextContent.subTitle}}}
Der PartNet-Datensatz enthält mehr als 573.000 feinkörnige Teileanmerkungen für eine bessere Erfüllung der Roboteraufgabe.
{{{sourceTextContent.description}}}
Wenn Sie möchten, dass ein Roboterarm eine Mikrowellentür öffnet, muss der Roboter wissen, wie er die Teile des Mikrowellenofens und die Tasten, die die Tür öffnen, identifizieren kann. Zu diesem Zweck hat eine Gruppe von Forschern einen groß angelegten Datensatz mit feinkörnigen, hierarchischen und auf Instanzebene erstellten Bauteilkommentare erstellt.
Auf der Konferenz über Computer Vision und Mustererkennung 2019 haben die Autoren Kaichun Mo von der Stanford University und Hao Su, ein Assistenzprofessor an der UC San Diego, gemeinsam mit Intel AI und der Simon Fraser University PartNet eingeführt. Der Datensatz besteht aus 573.585 feinkörnigen Bauteilannotationen (visuell und semantisch identifizierte Teilkomponenten) für 26.271 Formen (3D-Punktwolken von Objekten) über 24 Objektkategorien (Lampe, Tür, Tisch, Stuhl, etc.).
"Wenn wir wollen, dass die KI uns eine Tasse Tee machen kann, werden große neue Datensätze benötigt, um das Training von visuellen KI-Anwendungen zum Parsen und Verstehen von Objekten mit vielen kleinen Details oder mit wichtigen Komponenten besser zu unterstützen", sagten die Forscher in einem Blogbeitrag. "Bestehende 3D-Formdatensätze liefern Bauteilannotationen nur für eine relativ kleine Anzahl von Objektinstanzen oder für grobe, aber nicht hierarchische Bauteilannotationen, was diese Datensätze ungeeignet für Anwendungen mit Bauteilverständnis macht."
Die Forscher sagten, dass Menschen mit dem Datensatz beginnen können, eine groß angelegte simulierte Umgebung voller Objekte und all ihrer Teile zu bauen, mit dem Ziel, die virtuelle Welt zu nutzen, um Robotern etwas über Objekte, ihre Teile und die Interaktion mit ihnen beizubringen.
"Zum Beispiel kann ein Roboter lernen, dass das Drücken einer Taste an einer Mikrowelle die Mikrowellentür öffnet", sagten die Forscher. "Dies wird es uns ermöglichen, Roboter zu trainieren, um das tägliche Verhalten wie Menschen zu vervollständigen, indem wir alle beteiligten Teile und Schritte verstehen."
Die Forscher haben einen Beispieldatensatz, Probenergebnisse und ein Übersichtsvideo für diejenigen zur Verfügung gestellt, die PartNet ausprobieren möchten. Sie können die vollständige Arbeit hier lesen.
Kollaboratives Verstärkungslernen
Auf der Konferenz veröffentlichte Intel KI auch ein Paper über ein Konzept namens Collaborative Evolutionary Reinforcement Learning (CERL), das "Politikgradienten und Evolutionsmethoden kombiniert, um die Exploit/Erkundungsherausforderung zu optimieren" traditioneller Verstärkungslerntechniken.
Politikgradienten-basierte RL-Methoden, die heute von KI-Forschern häufig verwendet werden, können Belohnungen für das Lernen ausnutzen, aber "sie leiden unter begrenzter Erforschung und kostspieligen Gradientenberechnungen", sagten die Forscher. Mit dem Evolutionary Algorithmus-Ansatz werden einige der Probleme der Politikgradienten angegangen, was jedoch erhebliche Verarbeitungszeit in Anspruch nimmt, da die Kandidaten "erst am Ende einer kompletten Episode bewertet werden"
"Die ML-Kerndichotomie wird wieder aufgedeckt: die Wahl, entweder die Welt zu erforschen, um mehr Informationen zu erhalten und gleichzeitig kurzfristige Gewinne zu opfern, oder den aktuellen Wissensstand zur Verbesserung der Leistung zu nutzen", sagten die Forscher.
Um ihren neuen Ansatz zu testen, verwendeten die Forscher CERL mit dem OpenAI Gym Humanoid Benchmark, der ein 3D-Humanoidmodell benötigt, um zu lernen, so schnell wie möglich vorwärts zu gehen, ohne zu fallen. Bis vor kurzem sagten die Forscher, dass der Humanoid-Benchmark ungelöst sei, weil Roboter das Laufen lernen könnten, aber sie konnten einen nachhaltigen Lauf nicht aufrechterhalten. Die Autoren sagten, dass sie es mit dem CERL-Ansatz gelöst haben, und ein anderes Team der UC Berkeley hat es mit einem komplementären Ansatz gelöst, und beide Teams arbeiten daran, die Ansätze zu kombinieren.