3.6.1 fersterke freegje

Ferwizing jo ûndersyk nei digitale spoaren kin wêze lykas freget elkenien jo fragen op alle tiden.

Freegje it algemien komt yn twa wichtichste kategoryen: sample enkêtes en folkstellings. Sample ûndersiken, dêr't jo tagong ta in lyts tal minsken, kin wêze fleksibel, op 'e tiid, en relatyf goedkeap. Mar, sample ûndersiken, want se binne basearre op in stekproef, wurde faak beheind yn harren resolúsje; mei in stekproef survey, it is faak dreech om rûzings oer spesifike geografyske regio of foar spesifike demografyske groepen. Folkstellings, op 'e oare, besykje te ynterviewe elkenien yn' e befolking. Se hawwe grutte resolúsje, mar se binne it algemien djoer, smel yn fokus (se allinnich ûnder in lyts tal fan fragen), en net op 'e tiid (se barre op in fêst skema, lykas elke 10 jier) (Kish 1979) . No foarstelle as ûndersikers koe kombinearje de bêste skaaimerken fan sample enkêtes en folkstellings; foarstelle as ûndersikers koenen freegje alle fraach oan eltsenien alle dagen.

Fansels, dit fêste, ubiquitous, altyd-op enkête is in soarte fan sosjale wittenskip fantasy. Mar, docht bliken dat we kinne begjinne te approximate dit troch kombinearjen ûndersyk fragen út in lyts tal fan minsken mei digitale spoaren fan in soad minsken. Ik neam dit soarte fan kombinaasje fersterke freegje. As dien goed, it koe helpe ús jout rûzing dat binne mear lokale (foar lytsere geografyske gebieten), mear korrelige (foar spesifike demografyske groepen), en mear op 'e tiid.

Ien foarbyld fan fersterke freget komt út it wurk fan Jozua Blumenstock, dy't woe sammelje gegevens dy't soe helpe gids ûntwikkeling yn earme lannen. Mear spesifyk, Blumenstock woe te meitsjen fan in systeem om te mjitten rykdom en wolwêzen dy't kombinearre de folsleinens fan in folkstelling mei de fleksibiliteit en frekwinsje fan in enkête (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Yn feite, ik haw al beskreaun Blumenstock syn wurk koart yn haadstik 1.

Te begjinnen, Blumenstock partnered mei de grutste mobile telefoan provider yn Rwanda. It bedriuw levere him anonymized transaksje records út likernôch 1,5 miljoen klanten oangeande gedrach út 2005 en 2009. De logs befetsje ynformaasje oer elke oprop en tekst berjocht lykas de start tiid, duration, en approximate geografyske lokaasje fan de Caller en ûntfanger. Foardat wy begjinne te praten oer de statistyske saken, it is de muoite wurdich wiist út dat dizze earste stap kin ien fan de hurdste. Lykas beskreaun yn haadstik 2, meast digitale spoare gegevens is net tagonklik foar ûndersikers. En, in soad bedriuwen binne justifiably wifeljend te dielen harren gegevens omdat it privee; dat is harren klanten nei alle gedachten net ferwachtsje dat harren records wurdt dield-yn bulk-mei ûndersikers. Yn dit gefal, de ûndersikers namen hoedene stappen te anonymize de gegevens en harren wurk waard overseen troch in tredde-partij (ie, harren IRB). Mar, nettsjinsteande dy ynspannings, dizze gegevens binne nei alle gedachten noch identifisearre en se kâns befetsje gefoelige ynformaasje (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Ik sil werom nei dizze etyske fraach yn haadstik 6.

Bring dat Blumenstock wie ynteressearre yn it mjitten rykdom en wolwêzen. Mar, dy trekken binne net direkt yn 'e oprop records. Yn oare wurden, dizze oprop records binne incomplete foar dit ûndersyk, in mienskiplik skaaimerk fan digitale spoaren dy't waard besprutsen yn detail yn haadstik 2. Mar, it liket oannimlik dat de oprop platen nei alle gedachten hawwe wat ynformaasje oer rykdom en wolwêzen. Sa, ien manier fan freegjen Blumenstock syn fraach koe wêze: is it mooglik om te foarsizzen hoe't immen sil reagearje nei in ûndersyk basearre op harren digitale trace gegevens? As sa, dan troch freegjen in pear minsken kinne wy ​​tink de antwurden fan elkenien oars.

Om beoardielje dit empirically, Blumenstock en ûndersyk assistinten út Kigali Ynstitút fan Wittenskippen en Technology neamd in stekproef fan sa'n tûzen mobile telefoan klanten. De ûndersikers ferklearre de doelen fan it projekt oan de dielnimmers, frege om harren ynstimming om keppele binne de enkête reaksjes oan de oprop platen, en doe frege se in rige fragen te mjitten harren rykdom en wolwêzen, lykas "Ha jo in eigen radio? "en" Wolle jo eigen in fyts? "(sjoch ōfbylding 3.11 foar in part list). Alle dielnimmers oan it ûndersyk waarden kompensearre finansjeel.

Folgjende, Blumenstock brûkt in twa-stap proseduere mienskiplik yn gegevens wittenskip: funksje engineering folge troch begelaat learen. Earst, yn de funksje engineering stap, foar elkenien dy't waard ynterviewd, Blumenstock omsetten de oprop platen yn in set fan skaaimerken oer eltse persoan; gegevens wittenskippers kinne neame dizze skaaimerken "funksjes" en sosjale wittenskippers soene neame se "fariabelen." bygelyks, foar eltse persoan, Blumenstock berekkene totaal oantal dagen mei aktiviteit, it tal distinct minsken in persoan west hat yn kontakt mei, it bedrach fan jild bestege op stjoertiid, en sa op. Kritysk, goede funksje engineering freget kennis fan it ûndersyk ynstelling. Bygelyks, as is it fan belang om te ûnderskieden tusken húshâldlike en ynternasjonale petearen (wy miskien ferwachtsje minsken dy't roppe ynternasjonaal te wêzen rikere), dan dat moat dien wurde op de funksje engineering stap. In ûndersiker mei bytsje begryp fan Rûanda miskien net ûnder dizze funksje, en dan de foarsizzend prestaasjes fan it model sil lije.

Folgjende, yn 'e begelaat learen stap, Blumenstock boude in statistyske model te foarsizze it ûndersyk nei oanlieding foar eltse persoan basearre op harren eigenskippen. Yn dit gefal, Blumenstock brûkt logistiek in regresje mei 10-fold cross-falidaasje, mar hy koe hawwe brûkt in ferskaat oan oare statistyske of machine learen oanpak.

Sa hoe goed hawwe it wurkje? Wie Blumenstock kinne foarsizze antwurden te tafoegje fragen as "jo eigen in radio?" En "jo eigen in fyts?" Mei help fan funksjes ôflaat fan oprop records? Soarte fan. De krektens fan de foarsizzings wienen heech foar guon trekken (Figure 3.11). Mar, is it altyd wichtich te ferlykje in kompleks foarsizzing metoade tsjin in ienfâldige alternatyf. Yn dit gefal, in ienfâldige alternatyf is om te foarsizzen dat elkenien sil jaan de meast foarkommende antwurd. Bygelyks, 97,3% rapportearre it besit fan in radio sa as Blumenstock hie foarsein dat elkenien soe melde it besit fan in radio hy soe hawwe hie in krektens fan 97,3%, dat is ferrassend te ferlykjen mei de prestaasjes fan syn mear komplekse proseduere (97.6% krektens). Yn oare wurden, al de Fancy gegevens en modellewurk ferhege de krektens fan de foarsizzing fan 97,3% nei 97.6%. Mar, foar oare fragen, lykas "Wolle jo eigen in fyts?", De foarsizzings ferbettere fan 54.4% oant 67.6%. Mear algemien, Figure 3.12 shows foar guon trekken Blumenstock net ferbetterjen folle fierder as allinnich it meitsjen fan de ienfâldige nulmjitting foarsizzing, mar dat foar oare trekken wie der wat ferbettering.

Figuer 3.11: foarsizzend krektens foar statistyske model oplaat mei oprop records. Resultaten út Tabel 2 fan Blumenstock (2014).

Figuer 3.11: foarsizzend krektens foar statistyske model oplaat mei oprop records. Resultaten út Tabel 2 fan Blumenstock (2014) .

Figuer 3.12: Fergeliking fan foarsizzend krektens foar statistyske model oplaat mei oprop records te ienfâldige nulmjitting foarsizzing. Punten wurde wat jittered te kommen oerlaap; sjoch tabel 2 fan Blumenstock (2014) foar eksakte wearden.

Figuer 3.12: Fergeliking fan foarsizzend krektens foar statistyske model oplaat mei oprop records te ienfâldige nulmjitting foarsizzing. Punten wurde wat jittered te kommen oerlaap; sjoch tabel 2 fan Blumenstock (2014) foar eksakte wearden.

Op dit punt jo miskien te tinken dat dy resultaten binne in wat teloarstellend, mar krekt ien jier letter, Blumenstock en twa kollega-Gabriel Cadamuro en Robert On-publisearre in papier yn Science mei substansjeel bettere resultaten (Blumenstock, Cadamuro, and On 2015) . Der wienen twa wichtige technyske redenen foar de ferbettering: 1) se brûkt mear ferfine metoaden (ie, in nije oanpak om feature technyk en in mear ferfine masine learen model) en 2) ynstee besykje om ôfliede antwurden nei yndividuele ûndersyk fragen (bygelyks, "Hawwe jo in eigen radio?"), sy besocht te ôfliede in gearstalde rykdom yndeks.

Blumenstock en kollega oantoand de prestaasjes fan harren oanpak yn twa manieren. Earst, se fûn dat foar de minsken yn harren sample, se koene dwaan in moaie goed wurk fan it foarsizzen fan harren rykdom út oprop records (Figure 3.14). Twadde, en hieltyd mear wichtiger, Blumenstock en kollega die bliken dat harren proseduere koe produsearje hege-kwaliteit rûzings fan de geografyske ferdieling fan rykdom yn Ruanda. Mear spesifyk, se brûkt harren machine learen model, dat waard oplaat op harren stekproef fan likernôch 1.000 minsken, te foarsizze de rykdom fan alle 1,5 miljoen minsken yn de call records. Fierder, mei de geospatial gegevens ynsletten yn it call gegevens (bring dat de oprop gegevens befettet de lokaasje fan de tichtst sel toer foar eltse oprop), de ûndersikers koenen skatte de likernôch wenplak fan eltse persoan. Nei't dy twa rûzings byinoar, it ûndersyk produsearre in rûzing fan de geografyske ferdieling fan abonnee rykdom op Prachtig romtlike granularity. Bygelyks, se koenen skatte de gemiddelde rykdom yn elk fan Rûanda fan 2148 sellen (de lytste bestjoerlike ienheid yn it lân). Dy foarsein rykdom wearden wiene sa korrelige se wiene dreech te kontrolearjen. Sa, de ûndersikers byinoar opteld harren resultaten te produsearjen rûzings fan de gemiddelde rykdom fan Rûanda fan 30 distrikten. Dizze district-nivo rûsd waarden sterk ferbân mei de rûzings fan in gouden standert tradisjonele ûndersyk, de Rûandeeske Demografyske en Health Survey (Figure 3.14). Hoewol't de rûzings fan de beide boarnen wienen ek, de rûzings fan Blumenstock en kollega wienen sa'n 50 kear goedkeaper en 10 kear flugger (wannear't kosten yn metten yn termen fan feroarlike kosten). Dy dramatyske delgong yn kosten betsjut dat earder as dat rinne alle pear jier-as is standert foar Demografyske en Health Surveys-de hybride fan lytse ûndersyk kombinearre mei grutte digitale spoare data wurde koe rinne elke moanne.

Figuer 3.13: Skematyske fan Blumenstock, Cadamuro, en On (2015). Call gegevens út de telefoan bedriuw waard omboud ta in matriks mei ien rige foar eltse persoan en ien kolom foar eltse funksje (i.e., fariabel). Folgjende, de ûndersikers boude in begelaat learen model te foarsizze it ûndersyk reaksjes út de persoan troch funksje matrix. Doe, de begelaat learen model waard brûkt om tarekkenje it ûndersyk reaksjes foar elkenien. Yn wêzen, de ûndersikers brûkt de antwurden fan sa'n tûzen minsken te tarekkenje de rykdom fan likernôch ien miljoen minsken. Ek, de ûndersikers rûsd de likernôch wenplak foar alle 1,5 miljoen minsken basearre op de lokaasjes fan harren petearen. Doe't dy twa rûzings waarden kombinearre-de rûsd rykdom en de skatting wenplak-de resultaten wiene ek te rûzings fan de Demografyske en Health Survey, in gouden-standert tradisjonele ûndersyk (Figure 3.14).

Figuer 3.13: Skematyske fan Blumenstock, Cadamuro, and On (2015) . Call gegevens út de telefoan bedriuw waard omboud ta in matriks mei ien rige foar eltse persoan en ien kolom foar eltse funksje (dws, fariabel). Folgjende, de ûndersikers boude in begelaat learen model te foarsizze it ûndersyk reaksjes út de persoan troch funksje matrix. Doe, de begelaat learen model waard brûkt om tarekkenje it ûndersyk reaksjes foar elkenien. Yn wêzen, de ûndersikers brûkt de antwurden fan sa'n tûzen minsken te tarekkenje de rykdom fan likernôch ien miljoen minsken. Ek, de ûndersikers rûsd de likernôch wenplak foar alle 1,5 miljoen minsken basearre op de lokaasjes fan harren petearen. Doe't dy twa rûzings waarden kombinearre-de rûsd rykdom en de skatting wenplak-de resultaten wiene ek te rûzings fan de Demografyske en Health Survey, in gouden-standert tradisjonele ûndersyk (Figure 3.14).

Figuer 3.14: Results út Blumenstock, Cadamuro, en On (2015). By de yndividuele-nivo, de ûndersikers koenen te dwaan in ridlike baan by it foarsizzen fan immen syn rykdom út harren oprop records. De skattings fan distrikt-nivo rykdom-dêr't waarden basearre op yndividuele-nivo rûzings fan rykdom en wenplak-de resultaten wiene ek te resultaten fan de Demografyske en Health Survey, in gouden-standert tradisjonele ûndersyk.

Figuer 3.14: Results út Blumenstock, Cadamuro, and On (2015) . By de yndividuele-nivo, de ûndersikers koenen te dwaan in ridlike baan by it foarsizzen fan immen syn rykdom út harren oprop records. De skattings fan distrikt-nivo rykdom-dêr't waarden basearre op yndividuele-nivo rûzings fan rykdom en wenplak-de resultaten wiene ek te resultaten fan de Demografyske en Health Survey, in gouden-standert tradisjonele ûndersyk.

Yn konklúzje, Blumenstock syn fersterke freget oanpak kombinearre survey gegevens mei digitale spoare gegevens te produsearjen rûzingen te fergelykjen mei goud-standert ûndersyk skattings. Dit bysûndere bygelyks ek clarifies guon fan de hannel-offs tusken fersterke freegje en tradisjonele ûndersyk metoaden. Earste, de fersterke freegjen rûzings wiene mear op 'e tiid, substansjeel goedkeaper, en mear korrelige. Mar, oan 'e oare kant, op dit stuit, is der net in sterk teoretyske basis foar dit soarte fan fersterke freegje. Dat is, dit iene bygelyks net sjen litte as it sil wurkje en as it sil net. Fierder, de fersterke freegje oanpak net noch hawwe goede manieren te kwantifisearjen ûnwissens om syn skattings. Mar, fersterke freegjen hat djippe ferbinings nei trije grutte gebieten yn statistiken-model-basearre post-stratification (Little 1993) , imputation (Rubin 2004) , en lytse-gebiet schatting (Rao and Molina 2015) en sa Ik ferwachtsje dat foarútgong sil wêze rapid.

Fersterke freegje folget in basis resept dat kin wurde ôfstimd op jo bepaalde situaasje. Der binne twa yngrediïnten en twa stappen. De twa yngrediïnten binne 1) in digitale spoare dataset dat is breed, mar tin (dat is, it hat in soad minsken, mar net de ynformaasje dy't jo nedich oer elk persoanen) en 2) in ûndersyk dat is smelle mar dik (dat is, it hat mar in pear minsken, mar it hat de ynformaasje dy't jo nedich oer dy minsken). Dan, binne der twa stappen. Earst, foar de minsken yn beide gegevens boarnen, it bouwen fan in masine learen model dat brûkt digitale spoare gegevens te foarsizze ûndersyk antwurden. Folgjende, brûk dat machine learen model te tarekkenje it ûndersyk antwurden fan elkenien yn 'e digitale spoar gegevens. Sa, as der wat fraach dat jo wolle freegje oan in soad minsken, sjoch foar digitale spoare gegevens fan dy minsken dy't soe brûkt wurde om te foarsizzen harren antwurd.

Fergelykjen Blumenstock syn earste en twadde besykjen oan it probleem ek yllustrearret in wichtige les oer de oergong fan twadde tiid nei tredde tiidrek oanpakken te ferkennen ûndersyk: it begjin is net de ein. Dat is, in protte kear, de earste oanpak sil net wêze de bêste, mar as ûndersikers trochgeande wurkjen, dingen kinne better. Mear algemien, doe't evaluearjen nije oanpak om sosjale ûndersyk yn it digitale tiidrek, is it fan belang om twa ûnderskieden weardeskattingen: 1) hoe goed docht dit wurk no en 2) hoe goed dwaan jo tinke dit miskien wurkje yn de takomst as de gegevens lânskip feroarings en as ûndersikers wije mear omtinken foar it probleem. Hoewol't, ûndersikers wurde oplaat om de earste soarte fan evaluaasje (hoe goed is dit bysûndere stikje fan ûndersyk), it twadde is faak wichtiger.