Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

Nowa technologia opracowana w laboratoriach Google pozwoli maszynom na dokładne rozpoznawanie i opisywanie treści umieszczonych na fotografiach.

ps
ps
Udostępnij artykuł:
Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

O opracowaniu nowatorskiego rozwiązania poinformowali na blogu laboratorium Google Research jego naukowcy - Oriol Vinyals, Alexander Toshev, Samy Bengio i Dumitru Erhan. Według nich udało się opracować system, który pozwoli maszynom rozpoznawać obrazy w podobny sposób, jak dzieje się to u człowieka.

- Ludzie bez trudu potrafią zamknąć w kilku słowach opisu treść, którą widzą na fotografii - tłumaczą badacze. - Dla komputerów to o wiele trudniejsze zadanie. Udało nam się jednak posunąć o krok naprzód i opracować oprogramowanie, które pozwala maszynom w automatyczny sposób precyzyjnie rozpoznać obiekty na zdjęciu, a dodatkowo prawidłowo je opisać. Taka technologia stwarza wiele niedostępnych dotąd możliwości i rozwiązań - podkreślają.

grafika

Oprogramowanie stworzone przez Google może między innymi pomóc osobom niepełnosprawnym (na przykład niewidomym) w zrozumieniu tego, co znajduje się na konkretnym zdjęciu, a także w otaczającej ich rzeczywistości bez pomocy innych, a jedynie przy użyciu komputera. Mechanizm bezbłędnie identyfikujący treść konkretnego obrazu i rozumiejący jego znaczenie okaże się też przydatny w systemach monitoringu lub identyfikacji.

Na blogu Google Research autorzy nowatorskiego oprogramowania wyjaśniają sposób jego funkcjonowania. Jest ono złożone z dwóch niezależnych sieci zbudowanych na wzór połączeń nerwowych u żywych istot. Jedna z sieci jest przeznaczona do rozpoznawania tego, co widzi, zadaniem drugiej jest precyzyjne opisanie otrzymanych danych. W rezultacie powstaje zespół, który pozwala na opisanie konkretnego obrazu z niewielkim marginesem błędu.

grafika

Vinyals, Toshev, Bengio i Erhan przyznają, że koncepcja opracowania nowego mechanizmu postrzegania obrazów powstała przy okazji prac prowadzonych nad doskonaleniem automatycznego tłumaczenia, które Google rozwija od wielu lat. Stosowana w tej technologii sieć rekurencyjna została zastąpiona siecią splotową, co w rezultacie pozwala na odczytywanie obrazów i ich opis w sposób o wiele bardziej dokładny i bezbłędny, niż miało to miejsce wcześniej, przed stworzeniem wspomnianego oprogramowania.

Author widget background

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

Tak chce rosnąć T-Mobile Polska. Będą nowości telewizyjne

Tak chce rosnąć T-Mobile Polska. Będą nowości telewizyjne

Gigant AI nie chce uczestniczyć w inwigilacji. Odrzuca ultimatum władz USA

Gigant AI nie chce uczestniczyć w inwigilacji. Odrzuca ultimatum władz USA

Edward Miszczak: nie mamy obsesji na punkcie TVN czy TVP

Edward Miszczak: nie mamy obsesji na punkcie TVN czy TVP

TVP pokaże 104 mecze mundialu. Nie wszystkie z komentarzem ze stadionów

TVP pokaże 104 mecze mundialu. Nie wszystkie z komentarzem ze stadionów

Baleriny i power dressing, czyli nowa definicja profesjonalizmu
Materiał reklamowy

Baleriny i power dressing, czyli nowa definicja profesjonalizmu

Biznes Enter z nową dziennikarką. Transfer z "Pulsu Biznesu"

Biznes Enter z nową dziennikarką. Transfer z "Pulsu Biznesu"