Mokslo pažanga: „TweetPsych“

Šią savaitę interneto paslaugų kūrėjas Danas Zarrella pradėjo naują paslaugą „TweetPsych“. Zarrella taip pat yra internetinės rinkodaros firmos „HubSpot“ rinkodaros vadovė. Zarrella save vadina „mokslininku“, nes spėju, kad tai skamba seksualiau nei „interneto kūrėjas“ ar „rinkodaros vadovas“, tačiau jis neišvardija jokių akademinių pažymėjimų. (Neminėčiau mokslininko ar įgaliojimų dalies, išskyrus tai, kad Zarrella pateikia konkrečius mokslinius teiginius apie savo naują tarnybą.)

Nauja įdomi paslauga parduodama kaip „psichologinis profiliavimas“, atsižvelgiant į tai, ką skelbiate „Twitter“. Tačiau iš tikrųjų tai yra tik turinio analizės paslauga, naudojant du psichologinius žodynus ir jūsų praėjusius 1 000 tviterių. Zarrella teigia, kad ši analizė „sukuria asmens psichologinį profilį“. Tikrasis psichologinis profiliavimas yra mokslas, kuris paprastai atliekamas ne tik su vienu žmogaus gyvenimo gabalu (pavyzdžiui, tuo, ką jis rašo mikro-tinklaraščių tarnyboje). Tada „TweetPsych“ pateikia prieštaringą tvirtinimą, kad jis skirtas „tik pramogoms“. Kuris?

Taip pat yra problemų su vienu iš žodynų, kuriuos Zarrella naudoja analizuodamas. Vienas žodynas - LIWC - yra galiojanti psichologinės lingvistikos duomenų bazė. Bet kitas, „English Regressive Imagery Dictionary“ (angl. English Regresive Imagery Dictionary, RID), yra kur kas mažiau. RID susideda iš maždaug 3200 žodžių ir šaknų, priskirtų 43 minčių ir nuotaikos kategorijoms. Pagrindinė RID problema yra ta, kad iš esmės neturi jokios mokslinių tyrimų paramos (nepaisant to, kad Zarrella citavo svetainę, atrodo, lyg ir taip). Jį sukūrė vienas profesionalas, kuris vėliau parašė krūvą knygų apie tai ir kitus psichoanalitinius procesus. Knyga nėra tas pats, kas recenzuoto mokslo žurnalo straipsnis (kaip žino tyrėjai), o RID visiškai neturi jokio empirinio pagrindo. Tai rodo, kad pusė analizės yra neteisinga dar mums neprasidėjus.

Antrasis žodynas, kalbinis tyrimas ir žodžių skaičius (LIWC), pirmiausia grindžiamas rašytiniu žodžiu - žmonių raštais - ar sakomu žodžiu, pavyzdžiui, terapijos seansas ar dviejų žmonių pokalbis. Jis nebuvo sukurtas analizuoti dirbtinai trumpus 140 simbolių įrašus, pavyzdžiui, tuos, kurie rasti „Twitter“. Žmonės tweetuodami sutrumpina žodžius, nes trūksta simbolių, ir nėra aišku, kad paprasčiausias kilminimas padės tiksliai išanalizuoti visus žodžius, parašytus skrydžio nestandartinėmis santrumpomis. O kaip ir pakartotiniai tweetai? Žmogus, persiimantis ką nors, nebūtinai yra „kalbantis“, o veikiantis kaip kito žmogaus žodžių ruporas. Ar paslauga skiriasi? Nežinodami problemos masto, neturėtumėte supratimo, ar jūsų analizė yra kažkaip dirbtinai neobjektyvi (nebent pirmiausia specialiai nagrinėjote tokio pobūdžio klausimus). Šios problemos yra išspręstos, tačiau šioje tarnyboje jos nebuvo išspręstos.

Zarrellos sugebėjimas per kelias sekundes greitai išanalizuoti 1 000 tweetų ir palyginti visą jame esantį tekstą su šiais dviem žodynais yra žavingas kalbinio programavimo žygdarbis. Tada susiduriama su iššūkiu: „Kaip pateikti analizės rezultatus apgalvotai, intuityviai ir praktiškai?“ Tai yra ta dalis, kurios TweetPsych tiesiog nepavyksta pristatyti.

Kadangi Zarrella, matyt, turi mažai psichologinio išsilavinimo, psichologijos rezultatai yra gana nepatenkinti. Gaunate sąrašą „savybių“ (savo asmenybės? Jūsų tvitingo?), Į kurias įeina tokie dalykai kaip „Okupacija ir darbas“. Šalia yra naudingas aprašymas: „Jūs daug kalbate apie darbus ir savo darbą“ bei balas.

Gee, ačiū už puikią įžvalgą.

Jūs neįsivaizduojate, ką reiškia rezultatas, nes nėra jo konteksto. Ar darbas 47,87 yra geras ar blogas? Koks vidurkis? Tarp kitų funkcijų yra „Dabartinis laikas“, „Judėjimas aukštyn“, „Teigiamos emocijos“, „Neigiamos emocijos“ ir dar trys dešimtys kitų kategorijų.

Ši analizės dalis, paremta LIWC, taip pat yra tokia pat gera, kaip pagrindinis LIWC žodynas. Nors tokios kategorijos kaip darbas, pasiekimai ir laisvalaikis yra „aktualūs rūpesčiai“, kuriuos LIWC gali nustatyti, ji neturi kategorijos, pavyzdžiui, „santykių problemos“. Bet jūs to nežinotumėte, nebent žinotumėte LIWC. Tai gali būti tai, ką paminėtumėte analizę atliekantiems žmonėms. Kitas populiarus aktualus turinys, apie kurį reguliariai rašoma tinkle, pvz., Politika, technologijos ir įžymybės, taip pat nėra LIWC dalis. Taigi vėlgi jie niekada nebus rodomi analizėje, net jei apie tai ir kalbėsite. Taigi informacija, kurią gali suteikti LIWC ir, be to, „TweetPsych“, yra ribota. (Naudojant pritaikytą žodyną kai kurios iš šių problemų išsprendžiamos, tačiau tai nėra „TweetPsych“ siūlomas žodynas.)

„Pirminis, konceptualus ir emocinis turinys“ iš RID yra visiškai neaprašytas, ir vėlgi, nieko negalima įdėti į bet kokio pobūdžio kontekstą ar supratimą. Bet kadangi tai nėra mokslinis žodynas, vis tiek galite beveik ignoruoti balus. Jie galėjo būti sukurti atsitiktinai ir pateikti tiek pat naudingos informacijos.

Paskutinė dabartinės analizės dalis yra „Kiti kaip jūs“, įprastas bet kurios socialinių tinklų paslaugos komponentas. Keista, kad šio komponento nebuvo pirmoje šio įrankio versijoje. Remiantis tik tuo, ką rašote „Twitter“, teigiama „Kai kurie žmonės, kurie mąsto kaip jūs“, tada pateikia sąrašą kitų žmonių, kurie apsilankė „TweetPsych“ ir įvedė savo vartotojo vardą analizuoti.

Žinoma, kad taip ne žmonių, kurie mąsto kaip jūs - žmonės, kurie tweetoja kaip jūs. Tai yra svarbus skirtumas. Paslauga, analizuojanti nedidelę dalį to, ką rašote kasdien, ir remdamasi analize, kurią gali sugadinti jos vartotojai plačiai vartodami santrumpas, tikrai negali teigti, kad analizuosite tai, ką jūs pagalvok.

Kiek patikimas yra „TweetPsych“? Na, šiandien, kai rašiau šį straipsnį, pastebėjau, kad visi paties Dano Zarrella balai pasikeitė dėl vieno tweeto (šiandien jis tik vieną kartą tweeted). Jo „užsiėmimo ir darbo“ balas sumažėjo 20%, o „esamo laiko“ balas - 16%. Jo abstrakčios minties rezultatas sumažėjo 16%. Kaip visa tai galėjo įvykti tik iš vieno tvito? Vienas tweetas, palyginti su 999 kitais jo tweetais, neturėtų taip paveikti savo balo. Nebent kas kita vyksta.(Palyginkite toliau pateiktą ekrano kopiją, nufotografuotą 14.55 val. ET, ir aukščiau pateiktą ekrano kopiją, padarytą šiandien 9.00 val. ET.)

Mano pačių rezultatai analizuojant Zarrella ankstesnius 1 000 tweetus programoje LIWC2007 rodo kažką labai skirtingo. Aš nežinau Zarrella metodikos (nes jis ja nepasidalino), bet aš paėmiau jo praeities 1 000 tweet'ų tekstą ir per LIWC juos apdorojau dviem pavidalais - kamieno ir "kaip yra". Nei vienas, nei kitas negamina nieko panašaus į tai, kas rodoma „TweetPsych“. Taip gali nutikti dėl to, kad jis naudojo senesnę žodyno versiją arba kažkokį transformacijos kintamąjį, kurį jis prideda prie „TweetPsych“ ir kurio neatskleidė. Šios LIWC2007 analizės rezultatus galite peržiūrėti čia. (Aš paryškinau geltonuosius dalykus, kuriuos pabrėžė „TweetPsych“, o žaliosiose vietose - „TweetPsych“ nebeišryškino; atkreipkite dėmesį į reikšmingą taškų skirtumą.) Vis dėlto tai priverčia susimąstyti, kas tiksliai vyksta su paslauga. Jei jos psichometrinis patikimumas ir pagrįstumas kelia abejonių, kiek tai naudinga?

„TweetPsych“ gauna daug teigiamos spaudos, į ją įmetama tik skepsis. CNet narys Joshas Lowensohnas rašė apie paslaugą ir tik praeityje pažymėjo: „Tai mažiau padaro psichologiją ir daugiau apie jūsų asmeninę leksiką, tačiau rezultatai vis dar yra gana linksma." Taip, smagu! Benas Pattersonas perėjo į „Yahoo!“ Tech. Sakė: „Deja, psichologiniai profiliai, kuriuos platina„ TweetPsych “, nėra nuosekli, pasakojimų įvairovė, kurią galite išgirsti iš psichiatro rezidento tema„ Teisė ir tvarka: nusikalstamas ketinimas “.“ Vis dėlto nuoseklus pasakojimas nėra daug naudingesnis. nei kai kurios nenusakomos kategorijos? Nei vienas iš žurnalistų, nei originalus straipsnis apie „Mashable“ (kur, nustebink !, bendradarbė Zarrella) nepastebi, kad trūksta psichologijos pagrindo, kurį Zarrella pateikia prie stalo. Niekas nesujungė taškų, kodėl rezultatai taip nepatenkina jų interpretacijų. Akivaizdu, kad technikos žurnalistai puikiai perskirsto savo teigiamus pranešimus spaudai, bet ne taip gerai, kad yra tikri žurnalistai, kurie įsigilina į teigiamą tokios tarnybos mokslą.

Žinoma, pats Zarrella prisipažįsta, kad tarnyboje daug negalvojo, kaip sakė „NY Post“"" Žmonės tiesiog mėgsta palyginti save su kitais žmonėmis ir bandyti "patekti į kitų žmonių galvas", - sako Zarrella. "Tai tarsi musė ant sienos terapijos seanse." "Terapijos seansas? Ar tikrai taip įžvalgu rasti ką nors, kalbantį apie „judėjimą aukštyn?“ Skubėdamas paskelbti paslaugą internete, Zarrella, matyt, niekada neuždavė klausimo: „Ar kuri nors iš šios informacijos iš tikrųjų yra naudinga?“ Tarnyba, kokia yra šiandien, yra neužbaigta mintis, į kurią dar nedaugelis užsuks.

Nepaisant savo apribojimų, „TweetPsych“ atvėrė duris būsimoms paslaugoms, kurios iš tikrųjų teikia naudingą, naudingą ir naudingą informaciją, kuri greičiausiai turėtų daugiau galiojimo. Įsivaizduokite, kad imate ne tik asmens tweetus, bet ir informaciją, esančią jo „Facebook“ profilyje, tinklaraštyje ir pan., Ir sudėkite viską į vieną didžiulį analizės variklį ... Tada toks variklis galėtų suteikti galimybę pateikti tikrą psichologinę įžvalgą apie asmenį atsižvelgiant į tai, ką jie sako internete.

Iki to laiko turime pirmakursių, tokių kaip „TweetPsych“, kurie iš tikrųjų turėtų būti vadinami „TweetFun!“ Nes nors su juo žaisti iš tiesų smagu, tai suteikia mažai psichologinio supratimo - išskyrus pačius negiliausius.

(Čia galite perskaityti papildomus Tylerio Hayeso „TweetPsych“ rūpesčius.)

!-- GDPR -->