Dideli duomenys: ar galime numatyti gyventojų tendencijas (pvz., Laimę) per „Health Apps“?

Daugiau nei prieš penkerius metus parašiau kūrinį „Patikimumas ir tinkamumas„ Web 2.0 “pasaulyje“. Kalbėta apie susirūpinimą rinkti duomenis iš neobjektyvių pavyzdžių - iš anksto nesuprantant, kokiais būdais būtent šie mėginiai gali būti šališki.

Dabar, kai yra daugybė programų - atsisiunčiamų programų žmonių išmaniesiems telefonams, matau, kad iškyla ta pati problema. Kūrėjai ir verslininkai siekia gauti duomenis iš šių programų, nesuprasdami gero, patikimo, mokslinio duomenų rinkimo pagrindų. Kodėl tai svarbu - ypač tada, kai norisi analizuoti visus šiuos „didžiuosius duomenis“ (pavyzdžiui, kvailas terminas ... pavyzdžiui, epidemiologijoje, mokslininkai tai tiesiog vadina „duomenimis“).

Ar šios programos gali rinkti asmens sveikatos duomenis be šališkumo ir kažkaip paversti jas kažko didesnio matavimu?

Trumpas atsakymas: ne, nelengva.

Žinoma, yra žmonių, kurie yra „kiekybiškai įvertinto savęs“ judėjimo dalis ir kurie nori sekti ir matuoti visus savo asmeninės sveikatos aspektus (ir, manoma, psichinę sveikatą). Bet tie žmonės šiuo metu yra 1 pranokstantys žmonės ir apskritai nėra jokie gyventojų atstovai.

Tokios mažumos gali greitai padaryti didžiąją dalį pastangų rinkti didesnius duomenų rinkinius, kad būtų galima išanalizuoti sveikatos ar gerovės tendencijas. Nors atliktos analizės gali ką nors pasakyti apie šią žmonių grupę, nederėtų siūlyti ją apibendrinti likusiems gyventojams (kurie demografiškai ir elgesiu gali atrodyti ir elgtis labai skirtingai).

Netrukus tai nepasikeis, nes daugumą sveikatos programų žmonės atsisiunčia, vieną ar du kartus naudoja ir po to atsisako. Yra priežastis, kodėl dauguma žmonių nustoja naudotis sveikatos programomis, ypač tomis, kurios skirtos veikti kaip duomenų dienoraštis. Jie nuobodūs! Duomenų apie save rinkimas yra tik labai nuobodus uždavinys daugumai iš mūsų, kad įsipareigotų aktyviai užsiimti kasdien (ar net kas savaitę).

Sudėtingas atsakymas: programos turi būti protingesnės, prijungtos

Duomenims rinkti skirtos sveikatos programos gali nepavykti, nes joms reikia aktyvaus vartotojo įvesties. Štai kodėl asmeniniai sveikatos įrašai iš esmės niekada nepasikeitė prasmingai. 2 Žmonės yra per daug užsiėmę gyvendami savo gyvenimą, kad būtų varginami pasakodami programai3, kokia yra jų kasdieninė metrika.

Kad sveikatos programos galiausiai pasisektų ten, kur dauguma kitų asmens sveikatos stebėjimo programinės įrangos bandymų nepavyko, jiems tenka pasyviai rinkti savo duomenis. Tai reiškia, kad nereikia vartotojo įvesties.

Žinoma, mes esame labai toli nuo tokios metrikos, kurioje pateikiami reikšmingi duomenys.Aišku, yra veikiančių įrenginių, kurie stebi, kiek jūs paleisite (žinoma, iš „Nike“). Bet veikianti programa yra nenaudinga, jei ji nekalba su mano dietos programa, mitybos programa ar mankštos programa. Arba mano dėmesingumo programa. Tai viena programa, matuojanti vieną metrą komplekse, kuris esu aš. Tai paprasčiausiai nėra daug.

Pasitikėjimas yra kertinis kertinis akmuo

Tokių tinkle sujungtų programų, kurios dalijasi visais jūsų sveikatos duomenimis, priėmimas taip pat turi dar vieną, mažiau techninę kliūtį - pasitikėjimą. Tokios kompanijos kaip „Facebook“ ir „Nike“ galiausiai atsako tik į vieną žmonių grupę - jų akcininkus. Tai reiškia, kad jei jų interesais yra analizuoti jūsų duomenis apie dalykus, iš kurių jie gali užsidirbti, jie tai padarys.

Startuoliai nėra geresni, nes vietoj akcininkų jie atsako tik rizikos kapitalo investuotojams - pinigų skolintojams, kurie tik ieško geriausios ir greičiausios investicijų grąžos.

Kodėl norėčiau patikėti savo sveikatos informacija - duomenimis, kurie galėtų būti panaudoti prieš mane ateityje atsisakant draudimo ar nustatant draudimo tarifus - įmonėms, kurios mažai suinteresuotos apsaugoti mano privatumą?

Tai vėl sugrąžina mus į pirmąjį punktą - šališką pavyzdį. Žmonės, mielai teikiantys visą savo informaciją apie sveikatą pelno siekiančioms įmonėms analizuoti, sugretinti ir galiausiai susieti su jumis (net jei tokie duomenys iš pradžių yra anonimizuoti) nėra tokie, kaip dauguma žmonių. Daugumai iš mūsų vis dar rūpi pasilikti savo sveikatos informaciją sau, kaip ir dauguma mūsų vis dar nori pasilikti savo finansinę informaciją sau.

Kur mes einame iš čia

Bandymas rinkti populiacijos duomenis (pvz., Atlikti epidemiologinius tyrimus) iš sveikatos programų turi keletą problemų ir galimybių, kurias nustatiau:

  • Nešališkas mėginių ėmimas dėl mažos mažumos žmonių, kurie aktyviai ir nuolat naudojasi sveikatos programomis
  • Mėginių ėmimą ir tolesnį naudojimą būtų galima pagerinti pasyvus prieš aktyvus duomenų rinkimas
  • Mėginių ėmimas ir naudojimas galėtų būti dar labiau patobulintas naudojant patikimą instituciją duomenims rinkti ir saugoti (ne pelno siekiančiai įmonei ar startuoliui).
  • Programos, kurios žino viena kitą ir keičiasi svarbiais sveikatos duomenimis apie mane, yra naujos kartos - vietoj to, kad būtų daugybė nutildytų, nežinančių (kvailų?) Programų

Manau, puiku, kad kūrėjai pažvelgia į sveikatos problemą, sukuria jai skirtą programą ir išleidžia ją pasauliui. Tačiau labai dažnai šios programos niekur nedingsta, be auditorijos. Arba dėl nesidomėjimo juos našlaitė originalūs kūrėjai. Kelios populiarios sveikatos programos, pritraukiančios tvirtą auditoriją, yra išimtis, o ne taisyklė. Ir net tada, kai jie plačiai pripažįstami, kaip ir mūsų šalies elektroninės medicininės apskaitos sistemos, jie nesusikalba.

Jei norite pasakyti ką nors autoritetingo ar prasmingo apie duomenis, surinktus iš programos, turite parodyti, kad duomenys yra iš tipiškos gyventojų imties. To neturint, jūsų duomenys mums pasakoja tik apie vieną mažytę gyventojų grupę - tokią, kuri neatrodo panaši į daugumą mūsų.

Išnašos:

  1. Ir bus artimiausioje ateityje [↩]
  2. Kodėl „Google“ rytoj pagaliau uždarys savo asmeninius sveikatos įrašus. [↩]
  3. Arba dar blogiau - ir dažniau - a visas programų rinkinys kurie nežino kito ir negali keistis duomenimis vienas su kitu [↩]

!-- GDPR -->