
Nowy artykuł naukowy przygotowany przez badaczy z Uniwersytetu Johnsa Hopkinsa pod kierownictwem Andrew Hundta wskazuje na potencjał uczenia robotów poprzez pozytywne wzmacnianie.
Sednem pomysłu jest oferowanie nagród robotom, gdy te wykonują zadanie w sposób poprawny, a nie wskazywanie ich złych wyborów. W przypadku robotów zachęty mają postać systemu punktów, którymi maszyna jest nagradzana za prawidłowo zrealizowane operacje. Doktorant twierdzi, że podczas testów jego metoda była w stanie znacznie skrócić czas szkolenia maszyny.
- Robot dąży do osiągania wyższego wyniku - powiedział Hundt w komunikacie związanym z badaniami - Szybko uczy się właściwego zachowania, aby uzyskać najkorzystniejszą nagrodę. Nauka, która dotychczas musiałaby trwać miesiąc, aby uzyskać stuprocentową skuteczność, w przypadku naszego rozwiązania została skrócona do zaledwie dwóch dni.
Zadania są nadal dość podstawowe, gdyż wśród nich znajdziemy układanie wieży z klocków czy poruszanie się w grze wideo, jednak naukowcy mają nadzieję, że przyszłe konstrukcje uczone na tej zasadzie będą w stanie wykonywać bardziej złożone i przydatne zadania w rzeczywistych aplikacjach.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- techcrunch

Komentarze (0)
Czytaj także
-
FM Logistic inwestuje w autonomiczne roboty na magazynach
FM Logistic przyspiesza z automatyzacją. W ramach wspólnej inwestycji z klientem firma wdrożyła właśnie autonomicznego robota MIR...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-
-