Reklama: Chcesz umieścić tutaj reklamę? Zapraszamy do kontaktu »
Powrót do listy wiadomości Dodano: 2023-07-03  |  Ostatnia aktualizacja: 2023-07-03
NVIDIA przekracza granice uczenia
fot. pixabay
fot. pixabay

Firma NVIDIA Robotics Research ogłosiła nową aplikację, która łączy monity tekstowe, wejście wideo i symulator, aby skuteczniej uczyć roboty wykonywania zadań manipulacyjnych, takich jak otwieranie szuflad, dozowanie mydła lub układanie klocków.

Ogólnie rzecz biorąc, metody manipulacji obiektami 3D działają lepiej, gdy tworzą wyraźną reprezentację 3D, zamiast polegać wyłącznie na obrazach z kamery. NVIDIA chciała znaleźć metodę, która wiązałaby się z mniejszymi kosztami obliczeniowymi i była łatwiejsza do skalowania niż tworzenie detalicznych reprezentacji 3D, takich jak woksele. W tym celu firma wykorzystała sieć neuronową multi-view transformer RVT do tworzenia wirtualnych widoków z danych z kamery.

Jest on zarówno skalowalny, jak i dokładny. RVT pobiera obrazy z kamery i opisy zadań jako dane wejściowe i przewiduje odpowiednie ułożenia chwytaka. W symulacjach zespół badawczy NVIDIA odkrył, że tylko jeden model RVT może dobrze działać w ramach 18 zadań RLBench z 249 wariantami.

Model może wykonywać różne operacje manipulacyjne w świecie rzeczywistym po zaledwie 10 demonstracjach w przeliczeniu na zadanie. Zespół przeszkolił pojedynczy model RVT na podstawie danych rzeczywistych oraz drugi na podstawie danych symulacyjnych RLBench. W obu ustawieniach do oceny wydajności zastosowano jednokrotnie wytrenowany model RVT.

Zespół stwierdził, że RVT miał o 26% wyższy względny wskaźnik sukcesu niż obecne modele. RVT jest nie tylko bardziej skuteczny niż inne, ale może również uczyć się szybciej niż tradycyjne. Model firmy NVIDIA trenuje 36 razy szybciej niż PerAct, kompleksowy agent do klonowania zachowania, osiągając 2,3 razy większą szybkość wnioskowania.

Chociaż RVT był w stanie przewyższyć podobne modele, ma pewne ograniczenia, które NVIDIA chciałaby dokładniej zbadać. W przyszłości zespół chciałby lepiej zoptymalizować specyfikację widoku przy użyciu zdobytych danych. RVT i jawne metody oparte na wokselach wymagają na dodatek skalibrowania elementów zewnętrznych - od kamery do podstawy robota - a w przyszłości inżynierowie chcieliby zbadać możliwości usunięcia tych ograniczeń.

(rr)

Kategoria wiadomości:

Nowinki techniczne

Źródło:
therobotreport
urządzenia z xtech

Interesują Cię ciekawostki i informacje o wydarzeniach w branży?
Podaj swój adres e-mail a wyślemy Ci bezpłatny biuletyn.

Komentarze (0)

Możesz być pierwszą osobą, która skomentuje tę wiadomość. Wystarczy, że skorzystasz z formularza poniżej.

Wystąpiły błędy. Prosimy poprawić formularz i spróbować ponownie.
Twój komentarz :

Czytaj także