Google wydało Gemini Robotics-ER 1.6, aktualizację autorskiego modelu AI skoncentrowaną na rozumowaniu i zaprojektowaną z myślą o obsłudze rzeczywistych zadań robotycznych, wymagających świadomości fizycznej i rozumienia kontekstu.
Nowa wersja odzwierciedla szerokie odejście branży od automatyzacji opartej na skryptach na rzecz ucieleśnionych systemów AI, które mogą rozumować o przestrzeni, obiektach i realizacji zadań w dynamicznych środowiskach. Ulepszone rozumowanie przestrzenne i wielomodowa percepcja stają się kluczowymi czynnikami umożliwiającymi wejście robotów na wyższy poziom autonomii w środowiskach przemysłowych i komercyjnych.
Model ma pełnić funkcję zaawansowanej warstwy rozumowania dla robotów, integrując rozumienie wizualne i przestrzenne z planowaniem zadań i realizacją celów. W porównaniu z wcześniejszymi wersjami Gemini Robotics-ER i Gemini 3.0 Flash, wersja 1.6 oferuje ulepszone funkcje, takie jak wskazywanie i zliczanie obiektów oraz określanie czy zadanie zostało wykonane. Funkcje te stają się coraz bardziej istotne, ponieważ roboty poruszają się w mniej ustrukturyzowanych środowiskach, stają się bardziej autonomiczne i korzystają z szerszej gamy systemów mobilności.
Godnym uwagi dodatkiem nowej wersji jest funkcja odczytu instrumentów, która umożliwia robotom interpretację odczytów ze wskaźników, mierników i wzierników powszechnie spotykanych w obiektach przemysłowych. Funkcja ta jest zgodna z rosnącym zapotrzebowaniem na autonomiczne inspekcje i monitorowanie stanu, szczególnie w sektorze energetyki, przemyśle przetwórczym i dużych zakładach produkcyjnych.
Gemini Robotics-ER 1.6 usprawnia również wnioskowanie wielokamerowe, umożliwiając robotom łączenie widoków z góry i efektorów w celu spójnego zrozumienia postępu zadania. Określanie realizacji celu jest traktowane jako centralna funkcja autonomiczna, która promuje decyzje o ponownym podjęciu działania lub przejściu do następnego kroku. Odzwierciedla to szerszy nacisk branży na autonomię w ramach pętli zamkniętej, w ramach której percepcja, wnioskowanie i działanie są stale weryfikowane pod kątem rezultatów.
Świadomość bezpieczeństwa i ograniczeń pozostają priorytetemi. Model wykazuje ulepszone przestrzeganie fizycznych limitów bezpieczeństwa, takich jak ograniczenia dotyczące masy obiektów lub materiałów, oraz lepszą identyfikację niebezpiecznych sytuacji w scenariuszach tekstowych i wideo.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- arcweb
Komentarze (0)
Czytaj także
-
Modułowe rozwiązania z zakresu automatyki zwiększające efektywność logistyki
Sprzęt gotowy na wyzwania przyszłości, inteligentne oprogramowanie oraz nowoczesne narzędzia elektroniczne przyspieszają projektowanie i...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-
-
