
Inżynierowie Microsoftu opracowali najbardziej zaawansowany system rozpoznawania mowy. Został niedawno przetestowany zgodnie ze standardem ustanowionym przez NIST. Odsetek zarejestrowanych błędów wyniósł w jego przypadku zaledwie 6,3%.
To dotychczas najlepszy wynik w dziedzinie przemysłowego rozpoznawania mowy. Specjalistom Microsoftu po piętach depczą jednak naukowcy IBM-u, którzy niedawno opracowali system popełniający błędy zaledwie w 6,6% przypadków.
Wyścig pomiędzy oboma koncernami trwa od lat. W 1995 roku to IBM mógł pochwalić się najbardziej zaawansowanym systemem, który mylił się z odsetkiem 43%. W 2004 roku udało się poprawić ten wynik blisko czterokrotnie, jednak dopiero rozwój sieci neuronowych w ostatnich latach pozwolił na zejście poniżej poziomu 10%. Warto wspomnieć, że uważa się, że człowiek rozpoznaje mowę ze skutecznością zaledwie 96%. Wyniki osiągane przez Microsoft oraz IBM są mu zatem bardzo bliskie.
Rekord ustanowiony przez inżynierów Microsoftu możliwy był dzięki opracowanemu przez firmę narzędziu Computational Network Toolkit. Wykorzystuje ono zaawansowane techniki optymalizacji, przyspieszając o rząd wielkości szybkość działania algorytmów uczenia się. W pracy nad systemem pomogło także równoległe przetwarzanie z wykorzystaniem jednostek GPU.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- kopalniawiedzy

Komentarze (0)
Czytaj także
-
Eksperci zdradzają - komu najbardziej zagraża sztuczna inteligencja?
Gorące dyskusje na temat sztucznej inteligencji toczyły się od dawna, ale po zeszłorocznej premierze chatbota ChatGPT OpenAI i jego ekspansji w...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-
-