Reklama: Chcesz umieścić tutaj reklamę? Zapraszamy do kontaktu »
Reklama: Chcesz umieścić tutaj reklamę? Zapraszamy do kontaktu »
Powrót do listy wiadomości Dodano: 2009-10-20  |  Ostatnia aktualizacja: 2009-10-20
System rozpoznawania obiektów z MIT
Naukowcy z MIT twierdzą, że skonstruowali komputer, który jest w stanie rozpoznawać obiekty dzięki nowopowstałym algorytmom.

Ich system rozpoznawania obiektów mógłby w przyszłości pozwolić komputerom przeszukiwać całe godziny nagrań wideo, by znaleźć jedną scenę. Twórcy wskazują również, że turysta przechadzający się ulicą w obcym mieście mógłby zrobić zdjęcie nieznanego pomnika i już po chwili otrzymać na jego temat informacje. Technologia ta mogłaby również udoskonalić mechanizmy poszukiwania w Internecie obrazów. Wyszukiwarka na hasło ‘Shakespeare’ wyszukiwała by faktycznie zdjęcia Shakespearea, a nie Gwyneth Paltrow w filmie ‘Zakochany Shakespeare’.

Zwykle algorytmy rozpoznawania obiektów muszą być wyuczone przy pomocy cyfrowych zdjęć obiektów, które są oznakowane. Przeszukując milion zdjęć oznaczonych słowem ‘samochód’, algorytm może nauczyć się rozpoznawać cechy wspólne obrazów samochodów. Problem polega jednak na tym, że dla każdej nowej klasy obiektów (drzewa, budynki) algorytm musi być szkolony od nowa.

System rozpoznawania obiektów stworzony przez naukowców z MIT nie wymaga szkolenia. A do tego identyfikuje obiekty z precyzją o 50 procent lepszą niż algorytmy dotychczasowe. System wykorzystuje zmodyfikowana wersję tego, co jest nazywane algorytmem estymacji ruchu, czyli rodzajem algorytmu wykorzystywanego do obrabiania filmów.

Jako, że kolejne klatki filmu różnią się od siebie bardzo niewiele, schematy kompresji danych często przechowują niezmienne elementy scen uaktualniając jedynie te elementy, które się zmieniają.

Algorytmy estymacji ruchu określają, które obiekty się poruszyły pomiędzy jedną klatką, a drugą. W przypadku filmu jest to względnie łatwe zadanie, gdyż większość obiektów nie przemieszcza się zbyt daleko w przeciągu jednej trzydziestej sekundy. Algorytm nie musi również wiedzieć czym dany obiekt jest. Rozpoznaje po prostu kontury i to jak obiekt zmienia się obserwowany z różnej perspektywy.

Nowy system opracowany przez naukowców z MIT traktuje niepowiązane ze sobą obrazy jakby były kolejnymi klatkami filmu. Gdy zmodyfikowany algorytm estymacji ruchu próbuje określić to, który obiekt poruszył się pomiędzy kolejnymi obrazami, zwykle wybiera obiekty tego samego rodzaju. Założy on, na przykład, że Infiniti rocznik 2006 z drugiego obrazu to ten sam obiekt, co Chevy rocznik 1965 z obrazu pierwszego. Jeśli pierwszy obraz pochodzi bazy danych wykorzystywanej do szkolenia komputerowych systemów wizyjnych, Infiniti zostanie oznaczone jako samochód. Im bardziej będą do siebie podobne oznakowane i nie oznakowane obiekty, tym lepiej algorytm będzie działał.

Zespół z MIT opracował i zaprezentował sieciowy system nazwany LabelMe, który umożliwia obecnym w sieci ochotnikom oznakowywanie cyfrowych obrazów. Stworzyli również stronę internetową nazwaną ’80 milionów miniaturowych obrazów’, która sortuje obrazy ze względu na ich treść.

(lk)

Kategoria wiadomości:

Z życia branży

Źródło:
The Engineer
urządzenia z xtech

Interesują Cię ciekawostki i informacje o wydarzeniach w branży?
Podaj swój adres e-mail a wyślemy Ci bezpłatny biuletyn.

Komentarze (0)

Możesz być pierwszą osobą, która skomentuje tę wiadomość. Wystarczy, że skorzystasz z formularza poniżej.

Wystąpiły błędy. Prosimy poprawić formularz i spróbować ponownie.
Twój komentarz :