Софтвер кој ја опишува содржината на сликата или видео снимката со најголема прецизност до сега, резултат на одвоена работа на научници од компанијата Google и Универзитетот Стенфорд, претставува уште еден чекор во развојот во вештачката интелигенција.
Понекогаш скоро идентично, како што тоа би го направил човек, оваа програма не само што препознава поединечни објекти на фотографии, туку и сложени сцени кои опфаќаат повеќе личности, предмети и активности.
На пример, опишува слика на која група млади играат фризби или слика на која се наоѓаат две пици на плех кој стои на шпорет, но може и да згреши па на слика од хартиен змеј во лет да опише како човек кој лета во воздух на својот сноуборд.
За почеток, може да се користи за каталогизација на интернет содржини, додека во иднина би можел да допринесе за развојот на технологијата која би им овозможила на роботите и слепите луѓе да се ориентираат во просторот.
Ова откритие би можело да ја унапреди работата со сигурносните камери и тоа така што тие не само што ќе идентификуваат личности туку би можеле да ги воочат нивните активности и автоматски да ги известат надлежните доколку станува збор за нешто недозволено.
Софтверот би можел значително да го поправи и квалитетот на пребарувањето на сликите на најголемиот светски пребарувач кој сега воглавно се темели на текст поврзан со слика или на зборови на страната на која се наоѓа сликата.
“Сликата говори и повеќе од 1000 зборови, но постојат ситуации во кои зборовите се најкорисни и затоа е важно да се најде начинот на кој можеме сликата автоматски да ја преведеме во зборови, а тоа да биде точно“, напишале истражувачите на Google на блогот во кој ја објавија веста за ова откритие.