„Big Data“ gali padėti kompiuteriams identifikuoti emocijas, susietas su vaizdais

Populiarios svetainės, tokios kaip „Twitter“, „Facebook“ ir kiti kanalai, dabar užpildytos nuotraukomis, kurios padeda žmogui geriau išreikšti mintis ir jausmus. Nauji tyrimai rodo, kad „didieji duomenys“ - bet koks toks didelis ar sudėtingas duomenų rinkinių rinkinys, kurį sunku apdoroti naudojant tradicines duomenų apdorojimo programas, gali būti naudojamas mokyti kompiuterius interpretuoti su vaizdais susijusį turinį ir jausmus.

Dr Jiebo Luo, Ročesterio universiteto informatikos profesorius, bendradarbiaudamas su „Adobe Research“ tyrėjais, neseniai Amerikos dirbtinio intelekto asociacijos (AAAI) konferencijoje pristatė pranešimą, kuriame aprašomas laipsniškas giliųjų konvoliucinių neuronų tinklas (CNN). .

Išmokytą kompiuterį galima naudoti norint nustatyti, kokius jausmus šie vaizdai gali sukelti. Luo sako, kad ši informacija gali būti naudinga įvairiems dalykams, pavyzdžiui, vertinant ekonominius rodiklius ar numatant rinkimus.

Tačiau užduotis yra sudėtinga. Sentimento teksto analizė kompiuteriu yra pati sudėtinga užduotis. Socialiniuose tinkluose nuotaikų analizė yra sudėtingesnė, nes daugelis žmonių išreiškia save vaizdais ir vaizdo įrašais, kuriuos kompiuteriui sunkiau suprasti.

Pavyzdžiui, politinės kampanijos metu rinkėjai dažnai pasidalins savo nuomone nuotraukomis.

Dviejose skirtingose ​​nuotraukose gali būti rodomas tas pats kandidatas, tačiau jie gali pateikti labai skirtingus politinius pareiškimus. Žmogus galėtų atpažinti vieną kaip teigiamą kandidato portretą (pvz., Kandidatas šypsosi ir pakelia rankas), o kitas neigiamą (pvz., Nugalėto kandidato paveikslas).

Tačiau nė vienas žmogus negalėjo pažvelgti į kiekvieną socialiniuose tinkluose rodomą paveikslėlį - tai tikrai „dideli duomenys“. Kad būtų galima pagrįstai spėti apie kandidato populiarumą, reikia išmokyti kompiuterius suvirškinti šiuos duomenis, o tai Luo ir jo bendradarbių požiūris gali padaryti tiksliau, nei buvo įmanoma iki šiol.

Tyrėjai užduotį išgauti sentimentus iš vaizdų traktuoja kaip vaizdo klasifikavimo problemą. Tai reiškia, kad kažkaip reikia analizuoti kiekvieną paveikslėlį ir ant jo užklijuoti etiketes.

Norėdami pradėti mokymo procesą, Luo ir jo bendradarbiai panaudojo daugybę „Flickr“ vaizdų, kurie buvo laisvai paženklinti mašininiu algoritmu su konkrečiomis nuotaikomis, esamoje duomenų bazėje, žinomoje kaip SentiBank (sukurta dr. Shih-Fu Chango grupės Kolumbijoje). Universitetas).

Tai suteikia kompiuteriui atspirties tašką, kad jis galėtų suprasti, ką gali perduoti kai kurie vaizdai.

Bet mašinoje sugeneruotose etiketėse taip pat yra tikimybė, kad ta etiketė bus teisinga, tai yra, ar tikras kompiuteris, kad etiketė teisinga?

Pagrindinis mokymo proceso etapas yra kitas, kai jie išmeta bet kokius vaizdus, ​​kurių nuotaikos ar nuotaikos, kuriomis jie buvo pažymėti, gali būti netiesa. Taigi jie naudojasi tik „geresniais“ etiketėmis pažymėtais vaizdais, kurie toliau mokomi palaipsniui tobulėjant galingo konvoliucinio neuroninio tinklo rėmuose.

Resaercheris nustatė, kad šis papildomas žingsnis žymiai pagerino nuotaikų, kuriomis pažymėtas kiekvienas paveikslėlis, tikslumą.

Jie taip pat pritaikė šį nuotaikos analizės variklį su keletu vaizdų, išgautų iš „Twitter“. Šiuo atveju jie naudojo „minios žvalgybą“, o keli žmonės padėjo suskirstyti vaizdus per „Amazon Mechanical Turk“ platformą.

Jie naudojo tik nedaug vaizdų, kad tiksliai sureguliuotų kompiuterį, tačiau taikydami šį domeno pritaikymo procesą jie parodė, kad jie gali pagerinti dabartinius „Twitter“ vaizdų nuotaikos analizės metodus.

Viena stebinanti išvada yra ta, kad vaizdų nuotaikų klasifikavimo tikslumas viršijo tų pačių „Twitter“ žinučių teksto klasifikacijos tikslumą.

Šaltinis: Ročesterio universitetas

!-- GDPR -->