Blogas tyrimas: populiarūs sekso paieškos terminai

Žmonės mėgsta seksą. Jiems taip patinka seksas, jie praleidžia daug laiko ieškodami jo internete. Eik figūra. (Galite pasakyti, kad čia ruošiuosi įsigilinti į tikrai aukštakulnius, svaiginančius dalykus ...)

Tyrėjai Ogi Ogas ir Sai Gaddamas neseniai išleido knygą Milijardas piktų minčių, išsamiai analizuodami 400 milijonų paieškų, kurias jie surinko iš „Dogpile“ paieškos sistemos. Iš šių 400 milijonų paieškų 13 procentų (55 milijonai) buvo skirti erotiniam turiniui.

Kaip sugedo tie 55 milijonai paieškų? Sužinokime ... bet pažvelkime ir į šių tyrėjų metodiką, norėdami sužinoti, ar jų išvados vertos popieriaus, ant kurio jie yra atspausdinti. (Jei nemanote, tikriausiai esate teisus.)

Taigi štai ko ieško „Dogpile“ žmonės, kai kalbama apie seksualinius interesus. Atminkite, kad žemiau esantys terminai yra bendra to pomėgio paieškos kategorija, apimanti įvairius terminų pakoregavimus. Šios permutacijos (pvz., Krūtų „papai“) nėra išvardytos toliau; pasitelkite fantaziją.

  1. Jaunimas - 13,5 proc
  2. Gėjus - 4,7 proc
  3. MILF (mama norėčiau F ***) - 4,3 proc
  4. Krūtys - 4,0 proc
  5. Apgaulingos žmonos - 3,4 proc
  6. Makštis - 2,8 proc
  7. Varpos - 2,4 proc

Šiukšlių įvežimas, šiukšlių išvežimas

Kompiuterių programavime yra senas posakis - GIGO: Garbage In, Garbage Out. Tai vienodai gerai taikoma bet kokiai mokslinei veiklai, kuri yra tokia pat gera, kaip ir duomenys, kuriuos pasirenkate analizuoti. Jei pradėsite nuo abejotino apibendrinamumo ar vertės duomenų rinkinio, galite susidaryti išvadas, kurios mažai susijusios su tikrove.

Šiuo atveju kyla didžiulė šių mokslininkų surinktų tyrimų duomenų problema. Jie nėra iš „Google“ ar net „Bing“. Jie kilę iš mažai žinomos paieškos sistemos, vadinamos „Dogpile“, kuri net nėra paieškos sistema. Kas yra „Dogpile“, yra tiesiog „Google“, „Yahoo“ ir „Bing“ paieškos rezultatų kaupimo variklis (kadangi „Bing“ dabar pateikia „Yahoo“ savo paieškos duomenis, nesu tikras, kodėl vis dar egzistuoja ši diferenciacija).

Tai nėra tas pats, kas „Google“ atlikta paieška per „Google.com“, arba „Bing“ paieška per „Bing.com“. Norėdami gauti šiuos rezultatus - rezultatus, kurie sudarė dabartinių tyrėjų duomenų rinkinį, iš tikrųjų turite apsilankyti „Dogpile“ svetainėje. Jei atliksite paiešką „Google.com“, šie tyrėjai nebūtų analizavę jūsų paieškos (kas yra prasminga, nes „Google“ ir „Bing“ nepadaro tyrėjams lengvai prieinamų duomenų, kuriuos surenka per paieškas).

Ko gero, „Dogpile“ mažai naudojamas, yra faktas, kad ji maišo remiamus paieškos skelbimus su natūralios paieškos rezultatais, praktiškai neturėdama jokio vizualinio ženklo. Mažas spausdinimas kiekvieno paieškos rezultato pabaigoje leidžia sužinoti, ar tai „remiamas“ rezultatas, ar ne, pvz., Skelbimas. Ieškant „depresijos“ „Dogpile“, 14 iš 20 pirmųjų paieškos rezultatų buvo skelbimai - ne visai tai, ką dauguma paprastų žmonių labai ilgai taikstydavosi.

Žmonės, ieškantys turinio internete, jau seniai nusprendė atsisakyti paieškos sistemų, kurios bando maišyti reklamą su realiais rezultatais. Priežastis paprasta - žmonės spustelės skelbimą, kai susidomės siūlomu produktu ar paslauga. Jie nemėgsta būti apgauti spustelėjus, jų manymu, paieškos rezultatus, tik sužinoję, kad tai buvo užmaskuotas skelbimas.

Taigi, kas naudoja „Dogpile“? Kas žino, bet greičiausiai tai nebus pagrindinis interneto vartotojas. Nors daugiau nei 150 milijonų žmonių naudojasi „Google“ ir 90 milijonų naudoja „Bing.com“, švelnūs „Dogpile“ 2–3 milijonai žmonių per mėnesį nublanksta ir yra kur kas mažiau nei 0,05 proc. Visos paieškos sistemos rinkos.

Ar galite atlikti tokio mažo duomenų rinkinio apklausą ir pabandyti panaudoti dūmus ir veidrodžius, kad atrodytų, jog iš tikrųjų atlikote tuos pačius novatoriškus tyrimus, kokius atliko Kinsey institutas 1950–1960 m.? Jūs tikrai galite.

Pavyzdžiui, Ogi Ogasas ir Sai Gaddamas teigė, kad jie išanalizavo 400 milijonų paieškų internete. Tačiau palyginkite šį skaičių su 3 milijardais paieškų, atliekamų kiekvieną dieną, teigia internetinė analitikos kompanija „Hitwise“. Staiga 400 mln., Nors ir atrodo įspūdingas skaičius vakuume, atrodo kur kas mažiau įspūdingas, kai patenka į kažkokį duomenų kontekstą. 400 milijonų paieškų prilygsta maždaug 3 valandoms. Per vieną dieną.

Kontekstas, žinoma, yra viskas, kalbant apie duomenų rinkinius, ypač kai šie duomenų rinkiniai greičiausiai bus neobjektyvūs būdais, kurių niekada nesivarginote tirti. Šiuo atveju duomenų rinkinys yra šališkas naudojant „Dogpile“ paieškos variklį - mažą, nišinę paieškos variklį, kuris labiau tikėtinas nei naudojamas tam tikros populiacijos pogrupio, kuris skiriasi nuo likusios populiacijos.

Taigi paimkite šį sąrašą su druskos grūdeliu. Tai įdomu, bet nesu tikras, ar tai atspindi bendrą populiaciją. Ir tikrai neverta pirkti visos knygos, kurioje gilinamasi į šį ydingą duomenų rinkinį.

!-- GDPR -->