
Inżynierowie Mircosoftu z kolejnym rekordem. W ramach testu Switchboard ich systemowi rozpoznawania mowy udało się osiągnąć dokładność 94,9%, dorównując tym samym w tej kwestii człowiekowi.
Switchboard stanowi zbiór rozmów telefonicznych, który od ponad 20 lat wykorzystywany jest w testach dokładności systemów, które przekładają zasłyszany tekst na język pisany. W porównaniu do wyniku z ostatniego roku Microsoft poprawił wydajność swojego narzędzia o 12%.
Sukces jest efektem udoskonaleń modeli akustycznych i językowych opartych o konwolucyjną sieć neuronową połączoną z dwukierunkową pamięcią długo- i krótkoterminową (CNN-BLSTM). System trenowano przy wykorzystaniu Cognitive Toolkit 2.1 oraz chmury Azure.
Prace nad systemami rozpoznawania mowy trwają już od ćwierćwiecza. Pierwsze próby spółki z Redmond w tamtych czasach skończyły się rozpoznaniem mowy w zakresie 57%. Od tamtej pory było wyłącznie lepiej. Kolejnym wyzwaniem stojącym przed inżynierami Microsoftu jest nauczenie komputera rozumienia mowy, co stanowi całkowicie oddzielne wyzwanie.
(rr)
Kategoria wiadomości:
Nowinki techniczne
- Źródło:
- kopalniawiedzy

Komentarze (0)
Czytaj także
-
Jak zautomatyzować każdy proces przemysłowy?
Automatyzacja procesów jest kluczem do obniżania kosztów produkcji. Nie zawsze jest to proste, bo na proces przemysłowy składa się wiele...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-
-