Reklama: Chcesz umieścić tutaj reklamę? Zapraszamy do kontaktu »
Faulhaber robotic
Powrót do listy wiadomości Dodano: 2021-12-10  |  Ostatnia aktualizacja: 2021-12-10
Neuronowe modele języka dostępne publicznie
fot. pixabay
fot. pixabay

Ośrodek Przetwarzania Informacji (OPI PIB) oddał do użytku kolejne neuronowe modele języka – Polish RoBERTa v2 oraz GPT-2.

Tego typu modele wykorzystywane są coraz częściej w branży IT. Ich opracowanie wymaga jednak dużych mocy obliczeniowych oraz rozbudowanej infrastruktury. Wymagane są również ogromne ilości danych, którymi karmione są algorytmy sztucznej inteligencji. Większość modeli opracowuje się jednak dla języka angielskiego.

Polskojęzyczne modele można stosować do wykrywania fake newsów lub hejtu internetowego. Polskiego Internetu nie da się bowiem badać z wykorzystaniem obcojęzycznych modeli. Nowo udostępnione repozytoria opierają się na sieciach typu transformer, które wykorzystują symultaniczne przetwarzanie danych. Eksperci trenują jeden model maksymalnie przez 4 miesiące. Każdy z nich testowany jest następnie przez Kompleksową Listę Ewaluacji Językowych (KLEJ Benchmark) opracowaną przez Allegro.

(rr)

Kategoria wiadomości:

Nowinki techniczne

Źródło:
pap
urządzenia z xtech

Interesują Cię ciekawostki i informacje o wydarzeniach w branży?
Podaj swój adres e-mail a wyślemy Ci bezpłatny biuletyn.

Komentarze (0)

Możesz być pierwszą osobą, która skomentuje tę wiadomość. Wystarczy, że skorzystasz z formularza poniżej.

Wystąpiły błędy. Prosimy poprawić formularz i spróbować ponownie.
Twój komentarz :