Sztuczna inteligencja uczy się metodą prób i błędów, ale zwykle wymaga od ludzi tego, aby nadali jej możliwość działania, projektując algorytmy i reguły rządzące procesem uczenia się.
Wraz z postępem AI, działają jednak coraz częściej w sposób samodzielny. Przykładem jest nowy system opracowany przez naukowców, którzy wynaleźli nowy sposób uczenia się, czego efektem jest algorytm przewyższający wydajnością te zaprojektowane przez ludzi w ramach realizacji serii złożonych zadań.
Uczenie się przychodzi ludziom i zwierzętom w sposób naturalny dzięki milionom lat ewolucji, jednak AI zwykle musi być nauczane w sposób bezpośredni. Proces ten jest często powolny i pracochłonny, a ostatecznie ogranicza go ludzka intuicja. Wzorując się na ewolucji, która jest losowym procesem podejmowania prób i popełniania błędów, naukowcy stworzyli dużą cyfrową populację agentów AI. Próbowali oni rozwiązywać liczne zadania w wielu różnych, złożonych środowiskach, stosując określoną regułę uczenia się.
Czuwała nad nimi metasieć jako nadrzędna sztuczna inteligencja, która analizowała ich wydajność, a następnie zmieniała regułę uczenia, aby kolejne pokolenie mogło uczyć się szybciej i lepiej. Pozwoliło to systemowi odkryć nową zasadę, którą badacze nazwali Disco57. Przewyższa ona wszystkie dotychczas zaprojektowane przez ludzi.
Zespół wykorzystał Disco57 do wyszkolenia nowego agenta AI i porównał jego wydajność z najlepszymi algorytmami, takimi jak PPO i MuZero. Najpierw wyszkolono go na znanych grach Atari, a następnie na nieznanych mu dotąd wyzwaniach, takich jak ProcGen, Crafter oraz NetHack.
Wyniki okazały się znakomite. W teście Atari Benchmark algorytmy wyszkolone na Disco57 osiągnęły lepsze wyniki niż wszystkie algorytmy zaprojektowane przez ludzi. W obliczu nowych wyzwań system działał na najwyższym poziomie, co dowodzi, że odkrył własną regułę uczenia się.
- Nasze odkrycia sugerują, że algorytmy uczenia maszynowego, niezbędne dla zaawansowanej sztucznej inteligencji, mogą wkrótce być automatycznie generowane na podstawie doświadczeń agentów, a nie jak dotąd projektowane ręcznie - napisali naukowcy w artykule opublikowanym w czasopiśmie Nature - Praca stanowi krok w kierunku projektowania algorytmów uczenia maszynowego ze wzmocnieniem, które mogą konkurować z najlepszymi algorytmami tworzonymi manualnie, a nawet przewyższać je pod względem wydajności w przypadku wystąpienia trudnych warunków operacyjnych.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- techxplore
Komentarze (0)
Czytaj także
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
Jak poprawić wydajność na produkcji? Wyjaśniamy
Produkcja to istotna gałąź firm przemysłowych — im sprawniej działa, tym większe są zyski. Samo przyspieszenie procesów może nie być...
-
-
-
-
-
