
Trzech badaczy technologii sztucznej inteligencji z Google DeepMind we współpracy z kolegą z Uniwersytetu w Toronto opracowało algorytm AI Dreamer, który może nauczyć się samodoskonalenia, opanowując grę Minecraft w krótkim czasie. W ramach swojego badania opisanego w czasopiśmie Nature zaprogramowali aplikację AI grającą w tę grę bez przeszkolenia, by osiągnąć poziom eksperta w ciągu zaledwie dziewięciu dni.
W ciągu ostatnich kilku lat informatycy dowiedzieli się wiele o tym, jak głębokie uczenie może być wykorzystywane do trenowania aplikacji AI do wykonywania pozornie inteligentnych czynności, takich jak odpowiadanie na pytania. Naukowcy odkryli również, że aplikacje można trenować, aby grały w gry i wykonywały zadania lepiej niż ludzie. W ramach nowego podejścia naukowcy odkryli, że może ono przynieść postępy w zakresie pomocy aplikacjom AI w uczeniu się tego, jak poprawić swoje umiejętności w krótkim okresie. Może dać to robotom narzędzia, których potrzebują, aby dobrze radzić sobie w prawdziwym świecie.
W tym celu naukowcy zaprojektowali algorytm do gry w popularną grę Minecraft, budując odpowiedni system nagród. Dzięki temu podejściu aplikacja nie musiała być uczona, a jedynie musiała znać parametry, które mogła polepszać; jednym z nich było wizualizowanie wirtualnego świata przyszłości.
Gdy algorytm nauczył się grać w Minecrafta, naukowcy dodali do procesu nowy element - pozwolili mu sprawdzać się w danym scenariuszu tylko przez 30 minut. Po tym czasie gra była restartowana i ładowana ponownie z zupełnie nowym wirtualnym światem. Korzystając z tego podejścia, naukowcy odkryli, że algorytm szybko się poprawiał, osiągając ostatecznie poziom eksperta po zaledwie dziewięciu dniach gry.
Zespół badawczy sugeruje, że zdolność algorytmu do wyobrażania sobie przyszłości, w której wszystkie cele zostały osiągnięte, umożliwiła mu skupienie się wyłącznie na tych zadaniach, które doprowadzały do pożądanego celu. Następnie powtarzał tę metodę w każdym nowym wirtualnym świecie, na jaki natrafiał. Ten efekt mógłby zostać wykorzystany, aby pomóc robotom uczyć się tego, jak osiągać wstępnie zdefiniowane cele w świecie rzeczywistym.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- techxplore

Komentarze (0)
Czytaj także
-
Smart Flex Effector zwiększa czułość robotów
Moduł kompensacyjny, który można zainstalować w już istniejącym sprzęcie, z czujnikami i kinematyką o sześciu niezależnych stopniach swobody,...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-
-