Powrót do listy wiadomości Dodano: 2006-04-05  |  Ostatnia aktualizacja: 2006-04-05
Innowacyjny program odczyta tekst ze zdjęć
Innowacyjny program odczyta tekst ze zdjęć
Innowacyjny program odczyta tekst ze zdjęć
Powstał nowy rodzaj oprogramowania, które może okazać się niezwykle przydatne przy rozpoznawaniu i analizie tekstu występującego na zdjęciach fotograficznych.

Cyfrowe zdjęcie zatłoczonej ulicy zawiera olbrzymią ilość tekstu o różnych czcionkach, położeniu i orientacji. Występuje on na znakach drogowych, samochodach, tablicach z nazwami ulic, reklamach itd. Człowiek bez trudności potrafi zlokalizować i zrozumieć informacje tekstową zawarta w obrazie. Do momentu stworzenia specjalnego oprogramowania, wyodrębnienie tekstu ze zdjęcia przez komputer było niezwykle trudne. Programem który ma zrewolucjonizować technologię odczytywania tekstu ze zdjęć jest SceneReader. Ogólna zasada jego działania polega na tym, iż jako dane wejściowe otrzymuje on cyfrowy obraz, z którego po analizie wyodrębnia informacje tekstowe w nim zawarte i daje na wyjściu rozpoznany tekst w formacie użytecznym dla człowieka.

Algorytm użyty do tego programu używa modelu rozpoznawania tekstu zbliżony do tego, jakim na co dzień posługują się ludzie. Programiści stopniowo unowocześniali program, aż do obecnej, finalnej wersji.

SceneReader wykorzystuje trzy dane wejściowe: zdjęcie fotograficzne, słownik dozwolonych słów oraz baza danych czcionek. Do analizy zdjęcia używa technologii rozpoznawania obrazu zwanej Foveola, która jest nowym osiągnięciem w tej dziedzinie, zainspirowanym badaniami nad systemami wizualnymi, nagrodzonymi nagrodą Nobla.

System Foveola działa poprzez wykorzystanie ogólnego modelu sposobu reprezentowania różnych kształtów w ludzkim mózgu, co znacznie różnie się od konwencjonalnych metod probabilistycznych, opartych na sieciach neuronowych. Kiedy system „widzi” nowy dla siebie kształt, potrafi on nie tylko przypisać do niego podobne kształty ze swojej bazy danych, ale też ta nowa wiedza jaką posiadł nie nakłada się z tym, czego nauczył się wcześniej.

Dodatkowo SceneReader ma wbudowany model rozpoznawania sposobu ułożenia tekstu na zdjęciach oraz wykorzystuje techniki adaptacyjne do wykrycia i interpretacji struktury słów.

Firma która stworzyła oprogramowanie ma nadzieję, że uda jej się wcielić swój produkt do już istniejących narzędzi wykorzystywanych w wielu dziedzinach życia i przemysłu. Przykładowo SceneReader mógłby być nieocenioną pomocą dla niewidomych. W przemyśle wspierałby pracę robotów, w zastosowaniach militarnych byłby na wyposażeniu bezzałogowych zrobotyzowanych pojazdów, zaś w życiu codziennym mógłby być używany w samochodach, które dzięki takiemu oprogramowaniu, mogłyby czytać znaki drogowe i istotne dla kierowców informacje.

SceneReader może z powodzeniem pracować nawet ze zdjęciami słabej jakości, pochodzącymi np. z aparatów wbudowanych w telefony komórkowe, jak też z obrazem o bardzo wysokiej rozdzielczości, czy zeskanowanymi zdjęciami. Potrafi także współpracować z systemami kamer monitorujących.

Kategoria wiadomości:

Z życia branży

Źródło:
The Engineer
urządzenia z xtech

Interesują Cię ciekawostki i informacje o wydarzeniach w branży?
Podaj swój adres e-mail a wyślemy Ci bezpłatny biuletyn.

Komentarze (0)

Możesz być pierwszą osobą, która skomentuje tę wiadomość. Wystarczy, że skorzystasz z formularza poniżej.

Wystąpiły błędy. Prosimy poprawić formularz i spróbować ponownie.
Twój komentarz :