Socialinių tinklų tyrimų trūkumų paieška
Tyrėjai turi būti atsargūs dėl rimtų spąstų dirbant su didžiuliais socialinės žiniasklaidos duomenų rinkiniais, teigia Monrealio McGillo universiteto ir Carnegie Mellon universiteto Pitsburge informatikos specialistai.
Neteisingi rezultatai gali turėti didžiulę reikšmę: tūkstančiai mokslinių tyrimų kasmet yra pagrįsti duomenimis, surinktais iš socialinės žiniasklaidos.
"Daugelis šių straipsnių naudojami informuoti ir pagrįsti visuomenės ir pramonės bei vyriausybės sprendimus ir investicijas", - sakė dr. Derekas Ruthsas, McGillo kompiuterių mokyklos docentas.
Elgesio mokslininkams socialinės žiniasklaidos augimas atrodė beprecedentė galimybė užfiksuoti ir paskui analizuoti daug informacijos apie žmogaus elgesį.
Daugelis mokslininkų mano, kad tokie subrendę duomenų rinkiniai gali padėti numatyti žmogaus elgesį tokiu lygiu, kokio dar neįsivaizdavote. Pastaraisiais metais tyrimai tvirtino galimybę numatyti viską, pradedant vasaros šlageriais ir baigiant akcijų rinkos svyravimais.
Bet žurnale paskelbtame straipsnyje Mokslas, Ruths ir dr. Jürgenas Pfefferis iš Carnegie Mellon programinės įrangos tyrimų instituto išskiria keletą klausimų, susijusių su socialinės žiniasklaidos duomenų rinkinių naudojimu, ir strategijas jiems spręsti. Tarp iššūkių:
- Skirtingos socialinės žiniasklaidos platformos pritraukia skirtingus vartotojus - pavyzdžiui, „Pinterest“ dominuoja 25–34 metų moterys, tačiau tyrėjai retai ištaiso iškreiptą vaizdą, kurį gali sukelti šios populiacijos;
- Socialinės žiniasklaidos tyrimuose naudojami viešai prieinami duomenų sklaidos kanalai ne visada tiksliai atspindi visus platformos duomenis - ir tyrėjai paprastai nežino, kada ir kaip socialinės žiniasklaidos paslaugų teikėjai filtruoja savo duomenų srautus;
- Socialinės žiniasklaidos platformų dizainas gali nulemti, kaip vartotojai elgiasi, taigi ir kokį elgesį galima išmatuoti. Pavyzdžiui, „Facebook“ mygtuko „nepatinka“ nebuvimas daro neigiamą atsakymą į turinį sunkiau aptinkamą nei teigiamą „patinka“;
- Daugybė šlamšto siuntėjų ir robotų, kurie socialiniuose tinkluose maskuojasi kaip įprasti vartotojai, klaidingai įtraukiami į daugelį žmogaus elgesio matavimų ir prognozių;
- Tyrėjai dažnai pateikia lengvai klasifikuojamų vartotojų, temų ir įvykių grupių rezultatus, todėl nauji metodai atrodo tikslesni nei yra iš tikrųjų. Pavyzdžiui, pastangomis nuspėti „Twitter“ vartotojų politinę orientaciją pasiekiama vos 65 proc. Tikslumo tipiniams vartotojams, nors tyrimai (daugiausia dėmesio skiriant politiškai aktyviems vartotojams) teigė, kad tikslumas yra 90 proc. „Twitter“ vartotojai pasiekia vos 65 proc. Tikslumą tipiniams vartotojams, nors tyrimai (daugiausia dėmesio skiriant politiškai aktyviems vartotojams) teigė, kad tikslumas yra 90 proc.
Tyrėjai teigia, kad daugelis problemų taip pat būdingos kitoms sritims, tokioms kaip epidemiologija, statistika ir mašininis mokymasis.
"Bendra visų šių klausimų gija yra tai, kad tyrėjai turi tiksliau žinoti, ką iš tikrųjų analizuoja dirbdami su socialinės žiniasklaidos duomenimis", - sako Ruths.
Socialiniai mokslininkai jau anksčiau tobulino savo metodikas ir standartus, kaip įveikti tokio pobūdžio iššūkius.
„Liūdnai pagarsėjusi 1948 m.„ Dewey Defeats Truman “antraštė kilo iš telefoninių apklausų, kuriose buvo nepakankamai atrinkti Trumano šalininkai visoje populiacijoje“, - pažymi Ruths.
„Užuot visam laikui diskreditavus apklausos praktiką, ta ryški klaida lėmė šiuolaikiškesnes technologijas, aukštesnius standartus ir tikslesnes apklausas. Dabar mes pasirengę panašiam technologiniam posūkio taškui. Spręsdami problemas, su kuriomis susiduriame, galėsime realizuoti didžiulį gėrio potencialą, kurį žada socialinės žiniasklaidos tyrimai.
Šaltinis: McGill universitetas