Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

Nowa technologia opracowana w laboratoriach Google pozwoli maszynom na dokładne rozpoznawanie i opisywanie treści umieszczonych na fotografiach.

ps
ps
Udostępnij artykuł:
Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

O opracowaniu nowatorskiego rozwiązania poinformowali na blogu laboratorium Google Research jego naukowcy - Oriol Vinyals, Alexander Toshev, Samy Bengio i Dumitru Erhan. Według nich udało się opracować system, który pozwoli maszynom rozpoznawać obrazy w podobny sposób, jak dzieje się to u człowieka.

- Ludzie bez trudu potrafią zamknąć w kilku słowach opisu treść, którą widzą na fotografii - tłumaczą badacze. - Dla komputerów to o wiele trudniejsze zadanie. Udało nam się jednak posunąć o krok naprzód i opracować oprogramowanie, które pozwala maszynom w automatyczny sposób precyzyjnie rozpoznać obiekty na zdjęciu, a dodatkowo prawidłowo je opisać. Taka technologia stwarza wiele niedostępnych dotąd możliwości i rozwiązań - podkreślają.

grafika

Oprogramowanie stworzone przez Google może między innymi pomóc osobom niepełnosprawnym (na przykład niewidomym) w zrozumieniu tego, co znajduje się na konkretnym zdjęciu, a także w otaczającej ich rzeczywistości bez pomocy innych, a jedynie przy użyciu komputera. Mechanizm bezbłędnie identyfikujący treść konkretnego obrazu i rozumiejący jego znaczenie okaże się też przydatny w systemach monitoringu lub identyfikacji.

Na blogu Google Research autorzy nowatorskiego oprogramowania wyjaśniają sposób jego funkcjonowania. Jest ono złożone z dwóch niezależnych sieci zbudowanych na wzór połączeń nerwowych u żywych istot. Jedna z sieci jest przeznaczona do rozpoznawania tego, co widzi, zadaniem drugiej jest precyzyjne opisanie otrzymanych danych. W rezultacie powstaje zespół, który pozwala na opisanie konkretnego obrazu z niewielkim marginesem błędu.

grafika

Vinyals, Toshev, Bengio i Erhan przyznają, że koncepcja opracowania nowego mechanizmu postrzegania obrazów powstała przy okazji prac prowadzonych nad doskonaleniem automatycznego tłumaczenia, które Google rozwija od wielu lat. Stosowana w tej technologii sieć rekurencyjna została zastąpiona siecią splotową, co w rezultacie pozwala na odczytywanie obrazów i ich opis w sposób o wiele bardziej dokładny i bezbłędny, niż miało to miejsce wcześniej, przed stworzeniem wspomnianego oprogramowania.

Author widget background

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

Sandra Kubicka kontra Pudelek. Pozew ma trzysta stron

Sandra Kubicka kontra Pudelek. Pozew ma trzysta stron

Naczelny Money.pl z nową rolą w Wirtualnej Polsce. Awansował też Mateusz Cieślak

Naczelny Money.pl z nową rolą w Wirtualnej Polsce. Awansował też Mateusz Cieślak

Właściciel TVN tnie stratę. Rośnie HBO Max, spadki w telewizji

Właściciel TVN tnie stratę. Rośnie HBO Max, spadki w telewizji

Wspólny newsroom Wyborcza.pl i Gazeta.pl. Szefowa ma dwójkę zastępców

Wspólny newsroom Wyborcza.pl i Gazeta.pl. Szefowa ma dwójkę zastępców

Baleriny i power dressing, czyli nowa definicja profesjonalizmu
Materiał reklamowy

Baleriny i power dressing, czyli nowa definicja profesjonalizmu

Solorz razem z dziećmi, awans twórców Media Expert i ElevenLabs. Oto najbogatsi Polacy

Solorz razem z dziećmi, awans twórców Media Expert i ElevenLabs. Oto najbogatsi Polacy