Kaip mes išsiaiškiname, kurie tweetai yra patikimi

Džordžijos technologijos instituto mokslininkai sukūrė naują kalbos modelį, parodantį, kurie žodžiai ir frazės teigiamai ar neigiamai veikia „Twitter“ paskelbtų pasaulio įvykių patikimumą.

Tyrimas, kurio metu buvo nuskaityta 66 milijonai tweet'ų, susijusių su beveik 1400 realaus pasaulio įvykių, rodo, kad milijonų žmonių žodžiai socialiniuose tinkluose gali suteikti daug informacijos apie įvykio patikimumą, net kai renginys vis dar vyksta.

„Pastaraisiais metais buvo atlikta daug tyrimų apie socialinės žiniasklaidos patikimumą, tačiau labai mažai žinoma apie tai, kokie žodžių ar frazių tipai sukuria patikimumo suvokimą greitai vykstančių įvykių metu“, - sakė Džordžijos technikos mokslų daktarė Tanushree Mitra. kandidatas, vadovavęs tyrimams.

Komanda ištyrė „Twitter“ pranešimus apie pasaulio įvykius 2014 ir 2015 m., Įskaitant ebolos atsiradimą Vakarų Afrikoje, „Charlie Hebdo“ išpuolį Paryžiuje ir Erico Garnerio mirtį Niujorke.

Tyrėjai paprašė žmonių įvertinti žinutes pagal jų patikimumą (nuo „tikrai tikslios“ iki „tikrai netiksli“). Tada komanda sudarė žodžius pagal modelį, kuris juos suskirstė į 15 skirtingų kalbinių kategorijų. Klasifikacijose buvo teigiamos ir neigiamos emocijos, gyvatvorės ir stiprintuvai bei nerimas.

Tada „Georgia Tech“ kompiuteris išnagrinėjo žodžius, kad nuspręstų, ar tweetai buvo patikimi, ar ne. Tai sutapo su žmonių nuomone apie 68 proc. Laiko, o tai procentais žymiai daugiau nei atsitiktinė 25 proc.

"Tweets su stiprinamaisiais žodžiais, tokiais kaip" neginčijamas ", ir teigiamų emocijų terminai, tokie kaip" noras "ir" siaubingas ", buvo vertinami kaip labai patikimi", - sakė Mitra. „Žodžiai, rodantys teigiamą nuotaiką, bet pašiepiantys įvykio nepraktiškumą, tokie kaip„ ha “,„ šypsena “ar„ juokavimas “, buvo laikomi mažiau patikimais. Taip buvo ir apsidraudimo žodžiai, įskaitant „tam tikrą lygį“ ir „įtariamuosius“. “

Didesnis retweetų skaičius buvo susijęs su mažesniais patikimumo balais.Manoma, kad atsakymai ir pakartotiniai pranešimai, kurių ilgis ilgesnis, buvo patikimesni.

"Gali būti, kad ilgesnis pranešimų ilgis suteikia daugiau informacijos ar argumentų, todėl jie vertinami kaip patikimesni", - sakė ji. "Kita vertus, didesnis retweetų skaičius, kuris buvo įvertintas mažiau pagal patikimumą, gali būti bandymas sukelti kolektyvinius argumentus krizės ar netikrumo metu".

Nors modelis dar nėra diegiamas, mokslininkai teigia, kad galų gale gali sukurti programą, kuri galėtų apskaičiuoti suvokiamą įvykio patikimumą, kai jis atsiskleidžia socialinėje žiniasklaidoje.

„Kartu su kitais signalais, tokiais kaip įvykių temos ar struktūrinė informacija, mūsų kalbinis rezultatas gali būti svarbus automatizuotos sistemos elementas“, - sakė dr. Ericas Gilbertas, „Mitra“ patarėjas ir Džordžijos technikos interaktyviųjų kompiuterių mokyklos docentas.

„„ Twitter “yra dalis netiesos naujienų sklaidos internete problemos. Bet tai taip pat gali būti sprendimo dalis “.

Šaltinis: Džordžijos technologijos institutas

!-- GDPR -->