Neuronowe modele języka dostępne publicznie

Powrót do listy wiadomości Dodano: 2021-12-10 | Ostatnia aktualizacja: 2021-12-10

Ośrodek Przetwarzania Informacji (OPI PIB) oddał do użytku kolejne neuronowe modele języka – Polish RoBERTa v2 oraz GPT-2.

Tego typu modele wykorzystywane są coraz częściej w branży IT. Ich opracowanie wymaga jednak dużych mocy obliczeniowych oraz rozbudowanej infrastruktury. Wymagane są również ogromne ilości danych, którymi karmione są algorytmy sztucznej inteligencji. Większość modeli opracowuje się jednak dla języka angielskiego.

Polskojęzyczne modele można stosować do wykrywania fake newsów lub hejtu internetowego. Polskiego Internetu nie da się bowiem badać z wykorzystaniem obcojęzycznych modeli. Nowo udostępnione repozytoria opierają się na sieciach typu transformer, które wykorzystują symultaniczne przetwarzanie danych. Eksperci trenują jeden model maksymalnie przez 4 miesiące. Każdy z nich testowany jest następnie przez Kompleksową Listę Ewaluacji Językowych (KLEJ Benchmark) opracowaną przez Allegro.

(rr)

Kategoria wiadomości:

Nowinki techniczne

Źródło:: pap

Komentarze (0)

Możesz być pierwszą osobą, która skomentuje tę wiadomość. Wystarczy, że skorzystasz z formularza poniżej.

Uwaga! Aby dodać komentarz, konieczna jest obsługa JavaScript w Twojej przeglądarce. Jeśli - mimo włączenia jej - nadal nie możesz dodać komentarza, prosimy o kontakt pod adresem: biuro@xtech.pl