3.6.1 Amplified vra

Met 'n skakel jou opname digitale spore kan wees soos om te vra almal jou vrae te alle tye.

Vra kom algemeen in twee hoofkategorieë: steekproefopnames en sensusse. Steekproefopnames, waar jy toegang tot 'n klein aantal mense, kan buigsame, tydige, en relatief goedkoop wees. Maar steekproefopnames, omdat dit gebaseer is op 'n monster, is dikwels beperk in hul resolusie; met 'n steekproef, is dit dikwels moeilik om te skat maak oor spesifieke geografiese streke of vir 'n spesifieke demografiese groepe. Sensusse, aan die ander kant, probeer om almal 'n onderhoud in die bevolking. Hulle het 'n groot besluit, maar dit is oor die algemeen duur, smal in fokus (dit sluit slegs 'n klein aantal vrae), en nie betyds (dit gebeur op 'n vaste skedule, soos elke 10 jaar) (Kish 1979) . Nou dink as navorsers die beste eienskappe van steekproefopnames en sensusse kan kombineer; dink as navorsers elke vraag elke dag kon vra vir almal.

Dit is duidelik dat hierdie voortdurende, alomteenwoordige, altyd-op-opname is 'n soort van sosiale wetenskap fantasie. Maar, dit blyk dat ons kan begin om hierdie benader deur opname vrae kombinasie van 'n klein aantal mense met 'n digitale spore van baie mense. Ek noem hierdie tipe kombinasie versterk vra. As goed gedoen, kan dit ons help voorsien skatting dat meer plaaslike (vir kleiner geografiese gebiede) is, meer gedetailleerde (vir spesifieke demografiese groepe), en nog baie meer tydige.

Een voorbeeld van versterkte vra kom van die werk van Josua Blumenstock, wat wou data wat sal help om gids ontwikkeling in arm lande te samel. Meer spesifiek, Blumenstock wou 'n stelsel om rykdom en welsyn dat die volledigheid van 'n sensus met die buigsaamheid en frekwensie van 'n opname gekombineer meet skep (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Trouens, ek het reeds werk Blumenstock se kortliks beskryf in hoofstuk 1.

Om mee te begin, Blumenstock 'n vennootskap met die grootste selfoon diensverskaffer in Rwanda. Die maatskappy verskaf hom anoniem transaksie rekords van sowat 1,5 miljoen kliënte oor gedrag van 2005 en 2009. Die stompe bevat inligting oor elke oproep en SMS-boodskap soos die aanvang van die tyd, duur, en benaderde geografiese ligging van die oproeper en ontvanger. Voordat ons begin praat oor die statistiese kwessies, is dit die moeite werd om daarop te wys dat hierdie eerste stap een van die hardste kan wees. Soos beskryf in Hoofstuk 2, die meeste digitale spoor data is ontoeganklik vir navorsers. En, baie maatskappye is met reg huiwerig om hul data te deel, want dit is private; dit is hul kliënte waarskynlik nie verwag dat hul rekords sal gedeel word-in grootmaat-met navorsers. In hierdie geval, het die navorsers het versigtig stappe om die data te anonimiseren en hul werk is onder toesig van 'n derde party (dit wil sê, hulle IRR). Maar, ten spyte van hierdie pogings, hierdie data is waarskynlik nog identifiseerbare en hulle waarskynlik bevat sensitiewe inligting (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Ek sal terugkeer na hierdie etiese kwessie in Hoofstuk 6.

Onthou dat Blumenstock was geïnteresseerd in die meting van rykdom en welsyn. Maar, hierdie eienskappe is nie direk in die oproep rekords. Met ander woorde, hierdie oproep rekords is onvolledig vir hierdie navorsing, 'n algemene kenmerk van digitale spore wat in detail bespreek in Hoofstuk 2. Maar, dit lyk waarskynlik dat die oproep rekords waarskynlik 'n paar inligting oor rykdom en welsyn. So, een manier om te vra Blumenstock se vraag kan wees: is dit moontlik om te voorspel hoe iemand sal reageer op 'n opname wat gebaseer is op hul digitale spoor data? As dit so is, dan deur te vra 'n paar mense wat ons kan die antwoorde van al die ander dink.

Om hierdie empiries te evalueer, Blumenstock en navorsingsassistente uit Kigali Instituut van Wetenskap en Tegnologie bekend as 'n voorbeeld van 'n duisend mobiele kliënte telefoon. Die navorsers het verduidelik die doelwitte van die projek aan die deelnemers gevra om hul toestemming tot die opname antwoorde verwys na die oproep rekords, en dan vra hulle 'n reeks vrae aan hul rykdom en welsyn meet, soos "Het jy 'n radio? "en" Het jy 'n fiets? "(sien figuur 3.11 vir 'n gedeeltelike lys). Alle deelnemers aan die opname is finansieel vergoed.

Volgende, Blumenstock gebruik 'n twee-stap proses wat algemeen in data wetenskap: funksie ingenieurswese gevolg deur toesig leer. In die eerste plek in die funksie ingenieurswese stap, vir almal wat 'n onderhoud, Blumenstock omskep die oproep rekords in 'n stel eienskappe van elke persoon; data wetenskaplikes kan hierdie eienskappe noem "funksies" en sosiale wetenskaplikes sal hulle noem "veranderlikes." Byvoorbeeld, vir elke persoon, Blumenstock bereken totale aantal dae met 'n aktiwiteit, die aantal afsonderlike mense 'n persoon in kontak was met die bedrag geld spandeer op lugtyd, en so aan. Gee 'n kritiese, goeie eienskap ingenieurswese vereis kennis van die navorsing instelling. Byvoorbeeld, as dit is belangrik om te onderskei tussen plaaslike en internasionale oproepe (ons kan verwag dat mense wat internasionaal bel om ryker wees), dan is dit moet gedoen word by die funksie ingenieurswese stap. 'N Navorser met min begrip van Rwanda te sluit nie hierdie funksie, en dan die voorspelbare prestasie van die model sal ly.

Volgende, in die toesig leer stap, Blumenstock het 'n statistiese model om die opname reaksie vir elke persoon op grond van hul eienskappe te voorspel. In hierdie geval, Blumenstock gebruik logistieke regressie met 10-vou kruis-validasie, maar hy kon 'n verskeidenheid van ander statistiese of masjien leerbenaderings gebruik.

So hoe goed het dit gewerk? Was Blumenstock kan antwoorde voorspel op vrae soos opname "Het jy 'n radio besit?" En "Het jy 'n fiets?" Met behulp van funksies afgelei van oproep rekords? Soortvan. Die akkuraatheid van die voorspellings was hoog vir 'n paar eienskappe (Figuur 3.11). Maar, is dit altyd belangrik om 'n komplekse voorspelling metode te vergelyk teen 'n eenvoudige alternatief. In hierdie geval, 'n eenvoudige alternatief is om te voorspel dat almal die mees algemene antwoord sal gee. Byvoorbeeld, 97,3% berig besit van 'n radio so as Blumenstock voorspel het dat almal sal rapporteer besit van 'n radio hy sou 'n akkuraatheid van 97,3%, wat is verbasend soortgelyk aan die uitvoering van sy meer komplekse proses (97,6% akkuraatheid) gehad het. Met ander woorde, al die fancy data en modellering verhoog die akkuraatheid van die voorspelling van 97,3% tot 97,6%. Maar vir ander vrae, soos "Het jy 'n fiets?", Die voorspellings verbeter van 54,4% tot 67,6%. Meer in die algemeen, Figuur 3.12 toon vir 'n paar eienskappe Blumenstock nie verbeter veel verder as net die maak van die eenvoudige basislyn voorspelling, maar dit vir ander eienskappe was daar 'n verbetering.

Figuur 3.11: voorspellingsakkuraatheid vir statistiese model opgelei met oproep rekords. Resultate van Tabel 2 van Blumenstock (2014).

Figuur 3.11: voorspellingsakkuraatheid vir statistiese model opgelei met oproep rekords. Resultate van Tabel 2 van Blumenstock (2014) .

Figuur 3.12: Vergelyking van voorspellingsakkuraatheid vir statistiese model opgelei met oproep rekords om eenvoudige basislyn voorspelling. Punte word effens jittered om oorvleueling te vermy; sien tabel 2 van Blumenstock (2014) vir die presiese waardes.

Figuur 3.12: Vergelyking van voorspellingsakkuraatheid vir statistiese model opgelei met oproep rekords om eenvoudige basislyn voorspelling. Punte word effens jittered om oorvleueling te vermy; sien tabel 2 van Blumenstock (2014) vir die presiese waardes.

Op hierdie stadium kan dink dat hierdie resultate is 'n bietjie teleurstellend, maar net 'n jaar later, Blumenstock en twee kollegas-Gabriel Cadamuro en Robert On-gepubliseer 'n artikel in Science met aansienlik beter resultate (Blumenstock, Cadamuro, and On 2015) . Daar was twee hoof tegniese redes vir die verbetering: 1) wat hulle gebruik meer gesofistikeerde metodes (dit wil sê, 'n nuwe benadering tot die funksie ingenieurswese en 'n meer gesofistikeerde masjien leer model) en 2) eerder as 'n poging om antwoorde op individuele opname vrae aflei (bv, "Het jy 'n radio besit?"), het hulle probeer om 'n saamgestelde rykdom indeks aflei.

Blumenstock en kollegas gedemonstreer die uitvoering van hul benadering word op twee maniere. Eerstens, het hulle gevind dat die mense in hul monster, kan hulle 'n goeie werk te voorspel hul rykdom van oproep rekords (Figuur 3.14) doen. Tweedens, en al hoe meer belangrik, Blumenstock en kollegas het getoon dat hul prosedure hoë gehalte skattings van die geografiese verdeling van rykdom in Rwanda kon produseer. Meer spesifiek, gebruik hulle hul masjien leermodel, wat opgelei is in hul monster van ongeveer 1000 mense, om die rykdom van al 1,5 miljoen mense voorspel in die oproep rekords. Verdere, met die geospatiale data ingesluit in die oproep data (onthou dat die oproep data sluit die ligging van die naaste sel toring vir elke oproep), het die navorsers in staat was om te skat die geskatte woonplek van elke persoon. Om hierdie twee skattings saam, die navorsing wat 'n skatting van die geografiese verspreiding van intekenaar rykdom teen uiters fyn ruimtelike korrelig. Byvoorbeeld, kan hulle die gemiddelde rykdom skat in elk van Rwanda se 2148 selle (die kleinste administratiewe eenheid in die land). Hierdie voorspel rykdom waardes was so korrel hulle moeilik om te kyk was. So, het die navorsers versamel hul resultate skattings van die gemiddelde welvaart van Rwanda se 30 distrikte te produseer. Hierdie distrik-vlak ramings is sterk verwant aan die raming van 'n goue standaard tradisionele opname, die Rwandese Demografiese en Gesondheidsopname (Figuur 3.14). Hoewel die skattings van die twee bronne was soortgelyk, die skattings van Blumenstock en kollegas was ongeveer 50 keer goedkoper en 10 keer vinniger (wanneer koste in gemeet in terme van veranderlike koste). Hierdie dramatiese afname in koste beteken dat eerder as om elke paar jaar-as word gelei is standaard vir Demografiese en Gesondheidsopname Opnames-die kruising van klein opname gekombineer met 'n groot digitale spoor data kan elke maand uitgevoer word.

Figuur 3.13: Skematiese van Blumenstock, Cadamuro, en On (2015). Call data van die telefoon maatskappy is omskep in 'n matriks met 'n ry vir elke persoon en een kolom vir elke funksie (dit wil sê, veranderlike). Volgende, het die navorsers het 'n begeleide leermodel om die opname antwoorde van die persoon te voorspel deur kenmerk matriks. Dan is die toesig leermodel wat gebruik word om die opname antwoorde vir almal toereken. In wese is, het die navorsers gebruik die antwoorde van ongeveer 'n duisend mense tot die rykdom van ongeveer een miljoen mense toereken. Ook, het die navorsers beraam dat die beraamde woonplek vir al 1,5 miljoen mense op grond van die plekke van hul oproepe. Wanneer hierdie twee skattings gekombineer-die beraamde rykdom en die beraamde woonplek-die resultate was soortgelyk aan ramings van die Demografiese en Gesondheidsopname, 'n goue-standaard tradisionele opname (Figuur 3.14).

Figuur 3.13: Skematiese van Blumenstock, Cadamuro, and On (2015) . Call data van die telefoon maatskappy is omskep in 'n matriks met 'n ry vir elke persoon en een kolom vir elke funksie (dit wil sê, veranderlike). Volgende, het die navorsers het 'n begeleide leermodel om die opname antwoorde van die persoon te voorspel deur kenmerk matriks. Dan is die toesig leermodel wat gebruik word om die opname antwoorde vir almal toereken. In wese is, het die navorsers gebruik die antwoorde van ongeveer 'n duisend mense tot die rykdom van ongeveer een miljoen mense toereken. Ook, het die navorsers beraam dat die beraamde woonplek vir al 1,5 miljoen mense op grond van die plekke van hul oproepe. Wanneer hierdie twee skattings gekombineer-die beraamde rykdom en die beraamde woonplek-die resultate was soortgelyk aan ramings van die Demografiese en Gesondheidsopname, 'n goue-standaard tradisionele opname (Figuur 3.14).

Figuur 3.14: Resultate van Blumenstock, Cadamuro, en On (2015). Op die individuele vlak, het die navorsers in staat was om 'n redelike werk te doen by die voorspelling van rykdom iemand se van hul oproep rekords. Die raming van distrik-vlak-rykdom wat gebaseer is op beramings individuele vlak van rykdom en woonplek-die resultate was soortgelyk aan die resultate van die Demografiese en Gesondheidsopname, 'n goue-standaard tradisionele opname.

Figuur 3.14: Resultate van Blumenstock, Cadamuro, and On (2015) . Op die individuele vlak, het die navorsers in staat was om 'n redelike werk te doen by die voorspelling van rykdom iemand se van hul oproep rekords. Die raming van distrik-vlak-rykdom wat gebaseer is op beramings individuele vlak van rykdom en woonplek-die resultate was soortgelyk aan die resultate van die Demografiese en Gesondheidsopname, 'n goue-standaard tradisionele opname.

Ten slotte, Blumenstock se versterkte vra benadering gekombineer opname data met 'n digitale spoor data skattings vergelykbaar met goud-standaard opname skattings te produseer. Hierdie spesifieke voorbeeld verduidelik ook 'n paar van die kompromieë tussen versterk vra en tradisionele opname metodes. In die eerste plek die versterkte vra skattings was meer tydige, aansienlik goedkoper, en nog baie meer korrel. Maar, aan die ander kant, in hierdie tyd, is daar nie 'n sterk teoretiese basis vir hierdie soort versterk vra. Dit is, dit 'n voorbeeld wys nie wanneer dit sal werk en wanneer dit sal nie. Verder het die versterkte vra benadering nog nie 'n goeie manier om onsekerheid rondom sy skattings kwantifiseer. Maar versterk vra het diep verbintenisse met drie groot gebiede in die statistiek-model-gebaseerde post-stratifikasie (Little 1993) , toerekening (Rubin 2004) , en 'n klein-area skatting (Rao and Molina 2015) -en so ek verwag dat vordering sal wees vinnige.

Versterk vra volg 'n basiese resep wat aangepas kan word om jou spesifieke situasie. Daar is twee bestanddele en twee stappe. Die twee bestanddele is 1) 'n digitale spoor dataset dit is wyd, maar dun (dit wil sê, dit het baie mense, maar nie die inligting wat jy nodig het oor elke persoon) en 2) 'n opname wat nou maar dik (dit wil sê, dit het slegs 'n paar mense, maar dit het die inligting wat jy nodig het oor die mense). Dan is daar twee stappe. In die eerste plek vir die mense in beide databronne, bou 'n masjien leermodel wat digitale spoor data gebruik om opname antwoorde voorspel. Volgende, gebruik daardie masjien leermodel om die opname antwoorde van elkeen toereken in die digitale spoor data. Dus, as daar 'n paar vrae wat jy wil vra om baie mense, kyk vir digitale spoor data van die mense wat gebruik kan word om hul antwoord te voorspel.

Vergelyk Blumenstock se eerste en tweede poging om die probleem op te illustreer ook 'n belangrike les oor die oorgang van die tweede era aan derde era benaderings tot navorsingsopname: die begin is nie die einde nie. Dit is, baie keer, die eerste benadering sal nie die beste te wees, maar as navorsers voortgesette werk, kan dinge beter raak. Meer in die algemeen, wanneer die evaluering van nuwe benaderings tot sosiale navorsing in die digitale era, is dit belangrik om twee afsonderlike evaluerings te maak: 1) hoe goed nou werk dit en 2) hoe goed dink jy dit kan werk in die toekoms as die data landskap veranderinge en as navorsers te wy meer aandag aan die probleem. Alhoewel, is navorsers opgelei om die eerste soort evaluering (hoe goed is hierdie spesifieke stuk navorsing) te maak, die tweede is dikwels belangriker.