Ar kompiuteris gali išmokyti sveiko proto?
Ne per tolimoje praeityje siūlymas, kad kompiuteris gali parodyti „sveiką protą“, bus laikomas oksimoronu. Tačiau tokie superkompiuteriai kaip IBM „Watson“ gali parodyti naujus kompiuterių vaidmenis.Šiuo metu Carnegie Mellon universiteto mokslininkai 24 valandas per parą veikia kompiuterinę programą, siekdami užfiksuoti duomenis ir masiškai išmokyti sveiko proto.
Programa vadinama „Never Endding Image Learner“ (NEIL), nes programinė įranga ieško žiniatinklyje vaizdų ir daro viską, kad juos suprastų patys, o kurdama vis didesnę vaizdinę duomenų bazę, masiniu mastu kaupdama sveiką protą.
NEIL naudojasi naujausiais kompiuterio matymo laimėjimais, kurie leidžia kompiuterinėms programoms atpažinti ir paženklinti vaizduose esančius objektus, apibūdinti siužetus ir atpažinti atributus, tokius kaip spalvos, apšvietimas ir medžiagos, visa tai prižiūrint minimaliai.
Savo ruožtu jo sugeneruoti duomenys dar labiau sustiprins kompiuterių gebėjimą suprasti vizualų pasaulį.
NEIL turi didelę pažangą, palyginti su ankstesniais robotais, nes tai gali susieti dalykus, kad gautų sveiko proto informaciją. Informacija, kurią žmonės žino beveik intuityviai - kad automobiliai dažnai būna keliuose, kad pastatai būna vertikalūs ir kad antys atrodo kaip žąsys.
Remiantis teksto nuorodomis, gali atrodyti, kad spalva, susijusi su avimis, yra juoda, tačiau žmonės - ir dabar NEIL - vis dėlto žino, kad avys paprastai yra baltos.
"Vaizdai yra geriausias būdas sužinoti vizualines savybes", - teigė Carnegie Mellon robotikos instituto mokslų daktaras, daktaras Abhinavas Gupta.
„Vaizduose taip pat yra daug sveiko proto informacijos apie pasaulį. Žmonės to išmoksta patys ir, tikėdamiesi NEIL, tikimės, kad tai padarys ir kompiuteriai “.
Kompiuterių klasteris NEIL programą vykdo nuo liepos pabaigos ir jau išanalizavo tris milijonus vaizdų, nustatydamas 1500 objektų tipų pusė milijono vaizdų ir 1200 tipų scenų šimtuose tūkstančių vaizdų.
Jis sujungė taškus, kad išmoktų 2500 asociacijų iš tūkstančių atvejų.
Viena iš NEIL projekto motyvų yra sukurti didžiausią pasaulyje vizualiai struktūrizuotą žinių bazę, kurioje objektai, scenos, veiksmai, atributai ir kontekstiniai santykiai būtų paženklinti ir kataloguoti.
„Tai, ko mes išmokome per pastaruosius 5–10 metų kompiuterinio regėjimo tyrimų metu, yra tai, kad kuo daugiau duomenų turi, tuo geresnė kompiuterio vizija tampa“, - sakė Gupta.
Kai kurie projektai, tokie kaip „ImageNet“ ir „Visipedia“, bandė surinkti šiuos struktūrizuotus duomenis su žmogaus pagalba.
Tačiau interneto mastas yra toks didžiulis - vien „Facebook“ telpa daugiau nei 200 milijardų vaizdų - kad vienintelė viltis visa tai išanalizuoti yra išmokyti kompiuterius tai daryti iš esmės patiems.
Žmonės taip pat nurodo NEIL, kokių kategorijų objektus, scenas ir pan. Reikia ieškoti ir analizuoti. Tačiau kartais tai, ką randa NEIL, gali nustebinti net tyrėjus.
Pavyzdžiui, galima tikėtis, kad ieškant „obuolio“ gali būti rodomi vaisių ir nešiojamųjų kompiuterių vaizdai. Bet Gupta ir jo komanda, visi žemės dribsniai, nė nenumanė, kad ieškant F-18 bus galima identifikuoti ne tik naikintuvo vaizdus, bet ir F18 klasės katamaranus.
Vykdant paiešką, NEIL kuria subkategorijas - triratukai gali būti skirti vaikams, suaugusiesiems ir gali būti varomi, arba automobiliai yra įvairių markių ir modelių.
Ir tai pradeda pastebėti asociacijas - kad zebrai dažniausiai būna savannose ir kad akcijų prekybos grindys paprastai būna perpildytos.
Norint, kad NEIL taptų namų pavadinimu, reikės mažinti mastą, nes NEIL yra daug skaičiavimų, programa veikia dviejuose kompiuterių klasteriuose, kuriuose yra 200 apdorojimo branduolių.
Šaltinis: Carnegie Mellon universitetas