3.6.2 Magnified að spyrja

Þessi þýðing var búin til af tölvu. ×

3.6.2 Magnified að spyrja

Amplified að biðja um að nota fyrirsjáanlegan líkan til að sameina könnunargögn frá nokkrum einstaklingum með stóra gagnamagn frá mörgum.

Önnur leið til að sameina könnun og stóra gagnasöfn er ferli sem ég mun hringja í að mæla með því að spyrja . Þegar umfangsmikið er að spyrja, notar vísindamaður fyrirsjáanlegt líkan til að sameina lítið magn af könnunargögnum með stórum gagnamengi til þess að framleiða mat á mælikvarða eða korn sem ekki væri mögulegt með annaðhvort gagnagjafa. Mikilvægt dæmi um magnað spyrja kemur frá vinnu Joshua Blumenstock, sem vildi safna gögnum sem gætu hjálpað til við að leiðbeina þróun í fátækum löndum. Í fortíðinni þurfti vísindamenn að safna slíkum gögnum almennt að taka einn af tveimur aðferðum: sýnishornskönnunum eða censuses. Dæmi kannanir, þar sem vísindamenn ræða við lítið fólk, getur verið sveigjanlegt, tímanlega og tiltölulega ódýrt. Hins vegar eru þessar kannanir, vegna þess að þeir eru byggðar á sýni, oft takmörkuð í upplausn þeirra. Með sýnishornskönnun er oft erfitt að gera áætlanir um tiltekna landfræðilega svæði eða tilteknar lýðfræðilegar hópar. Merkingar, hins vegar, reyna að vekja athygli á öllum og því er hægt að nota þær til að framleiða áætlanir fyrir litla landfræðilega svæði eða lýðfræðilega hópa. En skoðanir eru almennt dýrir, þröngar í brennidepli (þau innihalda aðeins lítið af spurningum) og ekki tímabær (þau eiga sér stað á fastri áætlun, eins og á 10 ára fresti) (Kish 1979) . Frekar en að vera fastur með skoðanakönnunum eða censuses, ímyndaðu þér hvort vísindamenn geti sameinað bestu eiginleikum beggja. Ímyndaðu þér hvort vísindamenn gætu spurt alla spurninga til hvers og eins á hverjum degi. Augljóslega er þetta alls staðar nálægur, könnunarskönnun sem er eins konar samfélagsvísindi ímyndunarafl. En það virðist sem við getum byrjað að samræma þetta með því að sameina könnunarfyrirspurnir frá litlum fjölda fólks með stafrænum rekjum frá mörgum.

Rannsóknir Blumenstock hófust þegar hann átti samstarf við stærsta farsímafyrirtækið í Rúanda og fyrirtækið veitti nafnlausan viðskiptaskrá frá um 1,5 milljón viðskiptavinum á árunum 2005-2009. Þessar færslur innihéldu upplýsingar um hvert símtal og textaskilaboð, svo sem upphafstími, lengd , og áætlaða landfræðileg staðsetning þess sem hringir og móttakari. Áður en ég tala um tölfræðilegar tölur er það þess virði að benda á að þetta fyrsta skref gæti verið eitt af erfiðustu fyrir marga vísindamenn. Eins og ég lýsti í kafla 2 eru flestir stórar gagnagjafar óaðgengilegar fyrir vísindamenn. Sérstaklega er meta-gögn í síma sérstaklega óaðgengileg vegna þess að það er í grundvallaratriðum ómögulegt að nafnlausa og það inniheldur nánast (Mayer, Mutchler, and Mitchell 2016; Landau 2016) upplýsingar sem þátttakendur telja viðkvæmar (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Í þessu tiltekna tilviki var vísindamenn varlega að vernda gögnin og starf þeirra var umsjón þriðja aðila (þ.e. IRB). Ég mun fara aftur í þessar siðferðilegu málefni nánar í kafla 6.

Blumenstock hafði áhuga á að meta auð og vellíðan. En þessi eiginleiki er ekki beint í símaskránni. Með öðrum orðum eru þessar símaskrár ófullnægjandi fyrir þessa rannsókn - algengt í stórum gagnaheimildum sem rætt var nánar í kafla 2. Hins vegar virðist líklegt að símaskráin hafi líklega einhverjar upplýsingar sem gætu óbeint veitt upplýsingar um auð og vellíðan. Í ljósi þessa möguleika spurði Blumenstock hvort það væri hægt að þjálfa tölvuþjálfunarlíkan til að spá fyrir um hvernig einhver muni svara könnun á grundvelli símtalaskrár. Ef þetta væri mögulegt gæti Blumenstock notað þessa líkan til að spá fyrir um könnunarsvörun allra 1,5 milljón viðskiptavina.

Til þess að byggja upp og þjálfa slíka fyrirmynd kallaði Blumenstock og rannsóknaraðilar frá Kigali vísinda- og tæknisviði slembiúrtaki af um þúsund viðskiptavinum. Rannsakendur útskýrðu markmið verkefnisins fyrir þátttakendur, bað um samþykki þeirra að tengja könnunarsvörurnar við símtalaskrárnar og spurðu þá röðra spurninga til að mæla fé sitt og vellíðan, svo sem "Eigið þið útvarp? "og" Eigir þú hjól? "(sjá mynd 3.14 fyrir hluta lista). Allir þátttakendur í könnuninni voru greiddar fjárhagslega.

Næst, Blumenstock notaði tveggja þrepa málsmeðferð sem er algeng í véla nám: verkfræði sem fylgir eftirliti með námi. Í fyrsta lagi í verklagsverkstjórnuninni , fyrir alla sem voru viðtöl, breytti Blumenstock símtalaskrárnar inn í einkenni um hverja manneskju; Gögn vísindamenn gætu kallað þessa eiginleika "lögun" og félagsvísindamenn myndu kalla þá "breytur". Til dæmis, fyrir hverja einstakling, reiknaði Blumenstock heildarfjöldi daga með virkni, fjölda einstaklings sem einstaklingur hefur haft samband við, magn af peningum sem eytt er á tímanum og svo framvegis. Mikilvægt er að góð verkfræðiverkfræði krefst þekkingar á rannsóknarstillingunni. Til dæmis, ef mikilvægt er að greina á milli innlendra og erlendra símtala (við gætum búist við fólki sem hringir á alþjóðavettvangi til að vera ríkari), þá verður þetta að vera gert með verkfærisþrepinu. Rannsakandi með litla skilning á Rúanda gæti ekki falið í sér þennan eiginleika, og þá myndi fyrirsjáanlegur árangur líkansins þjást.

Næst, í umsjón læra skref, Blumenstock byggt líkan til að spá fyrir um könnun svar fyrir hvern einstakling á grundvelli eiginleika þeirra. Í þessu tilfelli notaði Blumenstock rökrétt afturhvarf, en hann gæti hafa notað ýmsar aðrar tölfræðilegar eða tölvuaðferðir.

Svo hversu vel virkaði það? Var Blumenstock fær um að spá svör við spurningalistum eins og "Ert þú með útvarp?" Og "Eigir þú hjól?" Með því að nota eiginleika sem eru úr símaskrám? Til að meta árangur af fyrirbyggjandi líkaninu hans, notaði Blumenstock krossgildingu , tækni sem almennt er notuð í gagnafræði en sjaldan í félagsvísindum. Markmiðið með krossgildingu er að veita sanngjarna mat á fyrirbyggjandi árangri líkansins með því að þjálfa það og prófa það á mismunandi undirhópum gagna. Einkum, Blumenstock hættu gögnin í 10 klumpur af 100 manns hvor. Síðan notaði hann níu af klumpunum til þess að þjálfa líkan hans og fyrirsjáanlegt frammistöðu þjálfaðra líkansins var metið á eftirlíkingunni. Hann endurtekið þessa aðferð 10 sinnum, þar sem hver klumpur af gögnum fékk eina snúa sem fullgildingargögn-og að meðaltali niðurstöðurnar.

Nákvæmni spárinnar var hár fyrir sum einkenni (mynd 3.14); Til dæmis, Blumenstock gæti spáð með 97,6% nákvæmni ef einhver átti útvarp. Þetta gæti hljómað áhrifamikið, en það er alltaf mikilvægt að bera saman flókna spáunaraðferð gegn einföldu vali. Í þessu tilviki er einfalt val að spá fyrir um að allir muni gefa algengasta svarið. Til dæmis töldu 97,3% svarenda eiga útvarp svo að ef Blumenstock hefði spáð að allir myndu tilkynna að hafa útvarp þá hefði hann haft nákvæmni 97,3%, sem er ótrúlega svipað og árangur hans flóknara málsmeðferð (97,6% nákvæmni) . Með öðrum orðum, allt ímynda gögn og líkan aukið nákvæmni spá frá 97,3% í 97,6%. Hins vegar, fyrir aðrar spurningar, svo sem "Eigir þú hjól?", Batnað spáin úr 54,4% í 67,6%. Almennt séð sýnir mynd 3.15 að í sumum eiginleikum batnaði Blumenstock ekki mikið út fyrir að gera einfaldan grunnspá, en fyrir aðra eiginleika var einhver framför. Þegar þú skoðar bara þessar niðurstöður, gætirðu þó ekki hugsað að þessi aðferð sé sérstaklega efnileg.

Mynd 3.14: Fyrirbyggjandi nákvæmni fyrir tölfræðilegan líkan sem þjálfaður er með símaskrám. Aðlaga frá Blumenstock (2014) , töflu 2.

Mynd 3.15: Samanburður á sjálfvirkri nákvæmni fyrir tölfræðilegan líkan sem þjálfaður er með símaskrár til einfaldrar grunnspá. Stig eru örlítið jittered til að forðast skarast. Aðlaga frá Blumenstock (2014) , töflu 2.

Hins vegar aðeins einu ári síðar, Blumenstock og tveir samstarfsmenn, Gabriel Cadamuro og Robert On, birtu blað í vísindum með verulega betri árangri (Blumenstock, Cadamuro, and On 2015) . Það voru tvær helstu tæknilegar ástæður fyrir þessum framförum: (1) þeir notuðu flóknari aðferðir (þ.e. ný aðferð við gerð verkfræði og flóknari líkan til að spá fyrir um svör frá eiginleikum) og (2) frekar en að reyna að slíta svör við einstökum könnunarspurningar (td, "Ert þú með útvarp?"), reyndu þeir að koma í veg fyrir samsettar auðlindavísitölur. Þessar tæknilegar endurbætur þýddu að þeir gætu gert sanngjarnt starf með því að nota símtalaskrár til að spá fyrir fé fyrir fólkið í sýninu.

Að spá fyrir um auðlind fólks í sýninu var hins vegar ekki fullkomið markmið rannsóknarinnar. Mundu að endanlegt markmið var að sameina nokkrar af bestu eiginleikum könnunarrannsókna og censuses til að framleiða nákvæmar áætlanir um fátækt í þróunarríkjum með mikilli upplausn. Til að meta getu sína til að ná þessu markmiði notaði Blumenstock og samstarfsmenn líkan þeirra og gögn þeirra til að spá fyrir um auðlind allra 1,5 milljón manna í símaskránni. Og þeir notuðu geospatial upplýsingar embed in símtalaskrár (muna að gögnin innihéldu staðsetningu næstu klefi turn fyrir hvert símtal) til að meta áætlaða búsetu hvers einstaklings (mynd 3.17). Með því að sameina þessar tvær áætlanir framleiddi Blumenstock og samstarfsmenn áætlun um landfræðilega dreifingu auðlinda áskrifenda við mjög fínt staðbundið korn. Til dæmis gætu þeir metið meðalgildi í hverja 2.148 frumum Rúanda (minnstu stjórnsýslueiningin í landinu).

Hversu vel jafngildir þessar áætlanir upp á raunverulegt fátæktarmörk á þessum svæðum? Áður en ég svara þeirri spurningu vil ég leggja áherslu á þá staðreynd að það eru margar ástæður til að vera efins. Til dæmis var hæfileiki til að gera spár á einstaklingsstigi frekar hávær (mynd 3.17). Og kannski meira um vert, fólk með farsíma gæti verið kerfisbundið frábrugðið fólki án farsíma. Þannig Blumenstock og samstarfsmenn gætu þjást af tegundum umfjöllun villum sem hlutdræg 1936 Literary Digest könnun sem ég lýst áður.

Til að öðlast skilning á gæðum áætlunarinnar þurfti Blumenstock og samstarfsmenn að bera saman þá með eitthvað annað. Sem betur fer, um leið og rannsókn þeirra stóð, var annar hópur vísindamanna að hlaupa með fleiri hefðbundnum félagslegum könnunum í Rúanda. Þessi annar könnun, sem var hluti af víðtæku lýðfræðilegu og heilsuáætluninni, var með mikið fjárhagsáætlun og notað hágæða, hefðbundnar aðferðir. Þess vegna gæti áætlunin frá lýðfræðilegum og heilbrigðiskerfinu verið talin vera góðar áætlanir. Þegar tveir áætlanir voru boraðar saman voru þær alveg svipaðar (mynd 3.17). Með öðrum orðum, með því að sameina lítið magn af könnunarupplýsingum við símaskrárnar, voru Blumenstock og samstarfsmenn fær um að framleiða áætlanir sem eru sambærilegar við þær sem eru aðgengilegar frá gögnum.

Efasemdamaður gæti séð þessar niðurstöður sem vonbrigði. Eftir allt saman, ein leið til að skoða þau er að segja að með því að nota stóra gagna- og vélaþjálfun, voru Blumenstock og samstarfsmenn fær um að framleiða áætlanir sem hægt væri að gera betur með nú þegar aðferðum. En ég held ekki að þetta sé rétti leiðin til að hugsa um þessa rannsókn af tveimur ástæðum. Í fyrsta lagi voru áætlanir frá Blumenstock og samstarfsmönnum um 10 sinnum hraðar og 50 sinnum ódýrari (þegar kostnaður er mældur hvað varðar breytilegan kostnað). Eins og ég hélt því fram fyrr í þessum kafla, vísindamenn hunsa kostnað við hættu þeirra. Í þessu tilviki þýðir stórkostleg lækkun á kostnaði því frekar en að hlaupa á nokkurra ára fresti - eins og staðalinn er fyrir lýðfræðilegar og heilbrigðiskannanir - þessi tegund af könnun gæti verið keyrð í hverjum mánuði sem myndi veita fjölmargir kostir fyrir vísindamenn og stefnu aðilar. Annað ástæðan fyrir því að ekki sé sýnandi að skoða er að þessi rannsókn veitir grunnuppskrift sem hægt er að stilla á margar mismunandi rannsóknaraðstæður. Þessi uppskrift hefur aðeins tvö innihaldsefni og tvö skref. Innihaldsefni eru (1) stór gagnaheimild sem er breiður en þunn (þ.e. það hefur marga en ekki þær upplýsingar sem þú þarft um hverja manneskju) og (2) könnun sem er þröng en þykkt (þ.e. það hefur aðeins nokkur fólk, en það hefur þær upplýsingar sem þú þarfnast um þá). Þessir innihaldsefni eru síðan sameinuð í tveimur skrefum. Í fyrsta lagi fyrir fólkið í báðum gagnasöfnum, byggðu fyrirmælum fyrir vél sem notar stóra gagnasöfn til að spá fyrir um könnunarsvörur. Næst skaltu nota þessi líkan til að kveða á könnunarsvörunum allra í stóru gagnasafni. Þannig að ef einhver spurning er um að spyrja fullt af fólki skaltu leita að stórum gögnum frá þeim sem gætu verið notaðir til að spá fyrir um svarið, jafnvel þótt þér sé sama um stóra gagnamagn . Það er, Blumenstock og samstarfsmenn höfðu ekki í eðli sínu umhugað um símaskrár; Þeir höfðu aðeins brugðist við símaskrár vegna þess að þeir gætu verið notaðir til að spá fyrir um könnunarsvar sem þeir höfðu áhyggjur af. Þessi einkennandi eingöngu óbeinn áhugi í stóru gagnamagninu-gerir mögulega að spyrja annað en embed in að spyrja, sem ég lýsti áðan.

Mynd 3.16: Skýring á rannsókninni af Blumenstock, Cadamuro og On (2015). Símtalaskrá frá símafyrirtækinu var breytt í fylki með einum línu fyrir hvern einstakling og einn dálki fyrir hvern eiginleika (þ.e. breytilegt). Næst settu vísindamennirnar undir eftirlits námsmódel til að spá fyrir um könnunarsvörunina frá einstaklingsbundnu fylkinu. Þá var eftirlits námsmodillinn notaður til að ávísa könnunarsvörun fyrir alla 1,5 milljónir viðskiptavina. Einnig gerðu vísindamenn áætlað áætlaðan búsetustað fyrir alla 1,5 milljónir viðskiptavina miðað við staðsetningar símtala þeirra. Þegar þessar tvær áætlanir - áætlað auður og áætlað búsetustaður - voru sameinuð, voru niðurstöðurnar svipaðar og áætlunum frá lýðfræðilegum og heilbrigðiskönnuninni, hefðbundin könnun í gulli (mynd 3.17).

Mynd 3.16: Skýring á rannsókninni af Blumenstock, Cadamuro, and On (2015) . Símtalaskrá frá símafyrirtækinu var breytt í fylki með einum línu fyrir hvern einstakling og ein dálki fyrir hvern eiginleiki (þ.e. breytu). Næst settu vísindamennirnar undir eftirlits námsmódel til að spá fyrir um könnunarsvörunina frá einstaklingsbundnu fylkinu. Þá var eftirlits námsmodillinn notaður til að ávísa könnunarsvörun fyrir alla 1,5 milljónir viðskiptavina. Einnig gerðu vísindamenn áætlað áætlaðan búsetustað fyrir alla 1,5 milljónir viðskiptavina miðað við staðsetningar símtala þeirra. Þegar þessar tvær áætlanir - áætlað auður og áætlað búsetustaður - voru sameinuð, voru niðurstöðurnar svipaðar og áætlunum frá lýðfræðilegum og heilbrigðiskönnuninni, hefðbundin könnun í gulli (mynd 3.17).

Mynd 3.17: Niðurstöður úr Blumenstock, Cadamuro og On (2015). Á einstökum vettvangi voru vísindamenn fær um að gera sanngjarnt starf við að spá fyrir um eign einhvers úr símaskrám þeirra. Áætlanir um auðlindir á héraðsstigi fyrir 30 héruðum Rúanda, sem byggjast á mati á auðlindum og búsetu á einstaklingsstigi, voru svipaðar niðurstöðum úr lýðfræðilegum og heilbrigðiskerfinu, sem er hefðbundin könnun í gulli. Breytt frá Blumenstock, Cadamuro og On (2015), tölur 1a og 3c.

Mynd 3.17: Niðurstöður úr Blumenstock, Cadamuro, and On (2015) . Á einstökum vettvangi voru vísindamenn fær um að gera sanngjarnt starf við að spá fyrir um eign einhvers úr símaskrám þeirra. Áætlanir um auðlindir á héraðsstigi fyrir 30 héruðum Rúanda, sem byggjast á mati á auðlindum og búsetu á einstaklingsstigi, voru svipaðar niðurstöðum úr lýðfræðilegum og heilbrigðiskerfinu, sem er hefðbundin könnun í gulli. Breytt frá Blumenstock, Cadamuro, and On (2015) , tölur 1a og 3c.

Niðurstaðan er sú að blönduðu sprautunaraðferð Blumenstock samanstóð af könnunargögnum með stórum gagnaheimild til að framleiða áætlanir sem eru sambærilegar við þær sem eru í gullskönnun. Þetta tiltekna dæmi skýrir einnig nokkrar afgreiðslur milli móttækilegra spurninga og hefðbundinna könnunaraðferða. Mældu spyrja áætlanir voru tímanlegri, verulega ódýrari og meira korn. En hins vegar er ennþá ekki sterk fræðileg grundvöllur fyrir þessa tegund af magnaðri spurningu. Þetta einstaka dæmi sýnir ekki hvenær þessi nálgun muni virka og hvenær það mun ekki og vísindamenn sem nota þessa nálgun þurfa að vera sérstaklega áhyggjur af hugsanlegum hlutdrægni af völdum sem er innifalinn-og hver er ekki með í stórum gagnaupptökum. Ennfremur hefur mælingaraðferðin ekki enn góð leið til að mæla óvissu um áætlanir sínar. Sem betur fer hefur magnað spurt djúp tengsl við þrjú stórum sviðum í tölfræðilegum litlum mæli (Rao and Molina 2015) , imputation (Rubin 2004) og líkansspár eftir stratification (sem sjálft er nátengt P. P., aðferðin sem ég lýsti áður í kaflanum) (Little 1993) . Vegna þessara djúpra tenginga býst ég við því að margt af aðferðafræðilegum grundvelli aukinnar spurnar verði fljótlega bætt.

Að lokum sýnir samanburður á fyrstu og síðari tilraunum Blumenstock einnig mikilvægan lexíu um félagslega rannsókn á stafrænu aldri: upphafið er ekki endirinn. Það er oftast fyrsta leiðin mun ekki vera sú besta, en ef vísindamenn halda áfram að vinna, þá getur það orðið betra. Almennt, þegar meta er nýjar aðferðir við félagslega rannsóknir á stafrænu aldri er mikilvægt að gera tvær mismunandi mat: (1) Hversu vel virkar þetta núna? og (2) Hversu vel mun þetta virka í framtíðinni þegar gögn landslagið breytist og sem vísindamenn leggja meiri áherslu á vandamálið? Þó að vísindamenn séu þjálfaðir til að gera fyrsta tegund matsins, þá er seinni oft mikilvægara.