3.6.1 Implikatioune Mindestpräis

Kënnen Äre Ëmfro bis digital Spure Joreswiessel wëll anscheinend jiddereen Är Froen op allen Zäiten.

Froen kënnt allgemeng zwou grouss Kategorien: Prouf Ëmfroen an de Pourcentage. Sample Ëmfroen, wou Dir eng kleng Zuel vu Leit den Zougang, kann flexibel, virgesinnen, an relativ bëlleg ginn. Allerdéngs, Prouf Ëmfroen, well se op enger Prouf baséiert sinn, sinn oft an hirer Resolutioun limitéiert; mat enger Prouf Ëmfro, ass et oft schwéier Schätzunge iwwer spezifesch geographesch Regiounen oder fir speziell demographescher Gruppen ze maachen. Pourcentage, op der aner, Versuch jiddereen zu der Populatioun zu Interview. Si hu grouss Léisung, mä si meeschtens deier, schmuel zu konzentréieren (si och nëmmen eng kleng Zuel vu Froen), an net virgesinnen (si op engem fixen Zäitplang geschéien, esou wéi all 10 Joer) (Kish 1979) . Elo stellt wann Fuerscher déi bescht Charakteristiken vun Prouf Ëmfroen an de Pourcentage kombinéieren kéinten; virstellen, wann Fuerscher all Fro ze jiddereen all Dag froen kéint.

Selbstverständlech, dat dauernd, onbeléifte, ëmmer-iwwert Ëmfro ass eng Zort vu sozialen Wëssenschaft Fantasie. Mä, schéngt et, datt mir fänken kann dat zu geschätzte duerch Ëmfro Froen vun enger klenger Zuel vu Leit mat digital Spure vu ville Leit kombinéiert. Ech nennen dës Zort vun geschéckt froen Kick. Wann gutt gemaach, kéint et hëlleft eis Devis gëtt dat méi lokal sinn (fir kleng geographesch Beräicher), méi käreg (fir spezifesch demographescher Gruppen), a méi virgesinnen.

Ee Beispill vun Implikatioune froen kënnt aus der Aarbecht vum Joshua Blumenstock, deen nach Donnéeën ze sammelen, déi guide Entwécklung an aarme Länner hëllefen géif. Méi genau, wollt Blumenstock engem System ze moossen Räichtum an d'Gutt-Ergoen, datt d'Vollständegkeet vun enger Enquête mat der Flexibilitéit an Frequenz vun enger Ëmfro kombinéiert ze schafen (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . An Tatsaach, hunn ech beschriwwen schonn Blumenstock d'Aarbecht kuerz am Kapitel 1.

Ufänken, sech Blumenstock mat de gréissten Operateur am Ruanda. Déi Firma gëtt him anonymized Transaktioun records vu ronn 1,5 Milliounen Clienten Eechenholz Behuele vun 2005 an 2009. D'Logbicher enthält Informatiounen iwwer all ruffen an SMS, wéi Ufank Zäit, Dauer, a geschätzte geographescher Lag vun der Ament an Receiver. Ier mir schwätzen iwwert d'Statistik Themen ufänken, ass et derwäert Virop eraus datt dës éischt Schrëtt eent vun den haardsten kann. Wéi am Kapitel beschriwwen 2, déi digital Spuer Donnéeën ass accessibel ze Fuerscher. An, si vill Firmen justifiably zéckt hir Donnéeën ze deelen, well et privat ass; dat ass hir Clienten wahrscheinlech net erwaarden, datt hir records gedeelt-a wäert Gros-mat Fuerscher. An dësem Fall huet d'Fuerscher virsiichteg Schrëtt d'Donnéeën an hir Aarbecht ze anonymize gouf vun engem Drëttel-Partei (dh, hir IRB) iwwersi. Mä trotz deenen Efforten, ginn dës Donnéeën wahrscheinlech nach identifizéieren a si enthale wahrscheinlech sensiblen Informatiounen (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Ëch 6 am Kapitel fir dësen ethesch Fro zréck.

Réckruff datt Blumenstock war interesséiert am Räichtum Moossen an d'Gutt-Ergoen. Mä, sinn dës Spure net direkt an d'appel Rekorder. An anere Wierder, si dësen Opruff records siche fir dës Fuerschung, eng gemeinsam Fonktioun vun digitale Spure déi am Detail am Kapitel diskutéiert gouf 2. Mee, schéngt et wahrscheinlech, datt d'appel records wahrscheinlech e puer Informatiounen iwwert Räichtum hunn an d'Gutt-Ergoen. Also, eng Manéier Blumenstock d'Fro vun froen kéint: ass et méiglech virauszesoen, wéi een op enger Ëmfro baséiert op hir digital Spuer Donnéeën z'äntwerten wäert? Wann jo, dann duerch e puer Leit froen kann mer d'Äntwerte vun hären roden.

Ze bewäerten haut zum dëst, Blumenstock a Fuerschung Assistenten aus Kigali Institut vu Wëssenschaft an Technologie genannt enger Prouf vu ronn enger dausend Handy Clienten. D'Fuerscher erkläert d'Ziler vum Projet de Participanten, gefrot fir hir Zoustëmmung der Ëmfro Äntwerte Appel records linken, an duerno gefrot, eng Serie vu Froen hire Räichtum an d'Gutt-Ergoen ze moossen, wéi "Do eege Dir eng radio? "an" Wëllt Dir engem Vëlo eege? "(kuckt 3,11 fir eng partiell Lëscht Dorënner). All Participant an der Ëmfro sech finanziell kompenséiert.

Next, benotzt Blumenstock eng zwee-Schrëtt Prozedur gemeinsam an Daten Wëssenschaft: Fonktioun Ingenieur vun iwwerwaachter Léieren gefollegt. Éischt, an der Fonctioun Ingenieur Schrëtt, fir jiddereen, datt am Interview war, ëmgerechent Blumenstock d'appel records an eng Formatioun vun Beméien ëm all Persoun; Donnéeën Wëssenschaftler kéint Charakteristiken "Fonctiounen" a sozial Wëssenschaftler hinnen géif Opruff ruffen "Verännerlechen." Zum Beispill, fir all Persoun, Blumenstock total Zuel vun Deeg mat Aktivitéit berechent, d'Zuel vun z'ënnerscheedde Leit eng Persoun mat am Kontakt ass, de Montant Suen op CNN ass, an esou op. Kritesch, Ingenieur gutt Fonktioun verlaangt Wësse vun der Fuerschung Kader. Zum Beispill, wann et wichteg ass tëscht Gewalt an international Uriff op z'ënnerscheeden (mir kéinten Leit erwaart déi international Opruff implizéiert ze ginn), da muss dat an der Fonctioun Ingenieur Schrëtt gemaach ginn. A Fuerscher mat wéineg Versteesdemech vun Rwanda vläicht net och dës Fonktioun, an da wäerten d'predictive Leeschtung vun de Modell leiden.

Next, gebaut vun der Opsiicht Léieren Schrëtt, Blumenstock engem statisteschen Model der Ëmfro Äntwert fir all Persoun op hir Fonctiounen baséiert zu virauszesoen. An dësem Fall, benotzt Blumenstock Logistikzenter Réckgang mat 10-fantastesch Kräiz-publizéieren, mee hien hätt eng Varietéit vun anere statistesch oder Maschinn Léieren Approche benotzt hunn.

Sou wéi gutt gemaach ass Aarbecht? War Blumenstock méiglech Äntwerten ze soe Froen ze Ëmfro wëll "Do eege Dir e Radio?" An "Do eege Dir e Vëlo?" Benotzt Fonctiounen aus Opruff records ofgeleet? Zimlech. Der Richtegkeet vun de Prognosen waren héich fir e puer Spure (Dorënner 3.11). Mee, et ass ëmmer wichteg, eng komplex Cepheid Method géint eng einfach Alternativ ze vergläichen. An dësem Fall ass eng einfach Alternativ ze soe, dass jiddereen déi gemeinsam Äntwert ginn ass. Zum Beispill, an Untersuchungshaft 97,3% e Radio Besëtz also wann Blumenstock virausgesot haten, datt jiddereen Rapport géif e Radio ëmsinn huet eng Genauegkeet vun 97,3% hu gesot hätt, déi zu der Leeschtung vun de méi komplex Prozedur iwwerraschend ähnlech ass (97.6% Genauegkeet). An anere Wierder, all d'Rees Donnéeën an haut kennt fräi der Richtegkeet vun der Cepheid vun 97,3% op 97,6%. Mä, fir aner Froen, wéi "Wëllt Dir engem Vëlo eege?", Verbessert d'Prognosen vun 54,4% op 67,6%. Méi allgemeng, fir Dorënner 3,12 weist puer Spure Blumenstock doriwwer eraus net vill verbessert einfach den einfachen baseline Cepheid bruecht, mee dat fir aner Spure eng Verbesserung do war.

Figur 3,11: Predictive Genauegkeet fir statistesch Modell mat Opruff records trainéiert. Resultater vun Table 2 vun Blumenstock (2014).

Figur 3,11: Predictive Genauegkeet fir statistesch Modell mat Opruff records trainéiert. Resultater vun Table 2 vun Blumenstock (2014) .

Figur 3,12: Se predictive Genauegkeet fir statistesch Modell mat Opruff records trainéiert ze einfach baseline Cepheid. Punkte sinn gehumpelt jittered iwwerlageren ze verhënneren; gesinn Table 2 vun Blumenstock (2014) fir genau Wäerter.

Figur 3,12: Se predictive Genauegkeet fir statistesch Modell mat Opruff records trainéiert ze einfach baseline Cepheid. Punkte sinn gehumpelt jittered iwwerlageren ze verhënneren; gesinn Table 2 vun Blumenstock (2014) fir genau Wäerter.

Op dësem Punkt Dir kéint denken, datt dës Resultater e bëssen enttäuschend sinn, mee just ee Joer méi spéit, Blumenstock an zwee Kollegen-Gabriel Cadamuro a Robert On-publizéiert engem Pabeier an Science mat méi besser Resultater (Blumenstock, Cadamuro, and On 2015) . Et waren zwee Haaptgrënn technesch Grënn fir d'Progressioun: 1) si méi mechanesch Methode benotzt (dh, eng nei Approche zu Fonktioun Ingenieur an engem méi mechanesch Maschinne léieren Modell) an 2) anstatt Versuch Äntwerte eenzelne Ëmfro Froen ze soen (zB, "Wëllt Dir engem Radio eege?"), probéiert si e Komposit Räichtum Index ze soen.

Blumenstock a Kollegen bewisen der Ausübung vun hirer Approche an zwou Manéieren. Éischt, hunn se dat fir d'Leit an hir Prouf, si eng relativ gutt Aarbecht vun en hire Räichtum aus Opruff records (Dorënner 3.14) maache konnt. Zweet, an ëmmer méi wichteg, Blumenstock a Kollegen gewisen, datt hir Prozedur héich-Qualitéit Schätzunge vun der geographescher Verdeelung vu Räichtum an Rwanda produzéiere konnt. Méi genau, benotzt si hir Maschinn Léieren Modell, deen op hir Prouf vu ronn 1.000 Leit trainéiert huet, de Räichtum vun all 1,5 Millioune Leit an der Opruff records virauszesoen. Weider, mat der vun den Opruff Donnéeën Ënnerbewosstsinn geospatial Donnéeën (drunn dass d'appel Daten fir all ruffen d'Lag vun den nooste Zell Tuerm gehéiert), huet sech de Fuerscher konnt den ongeféiere Plaz vun Residenz vun all Persoun ze schätzen. Ausgebaut zesummen dës zwee Devisen, produzéiert d'Recherche eng Estimatioun vun der geographescher Verdeelung vun Abonnent Räichtum op extrem delikat raimlech granularity. Zum Beispill, kéint si der Moyenne Räichtum vun jidderengen vun 2148 Zellen d'Rwanda Devis (de klengste administrativ Unitéit an d'Land). Dës virausgesot Räichtum Wäerter sech sou käreg si schwéier ze kontrolléieren. Also, aggregéiert d'Fuerscher hir Resultater Schätzunge vun der Moyenne Räichtum vun 30 Quartieren de Rwanda ze produzéieren. Dës Uertschaft-Niveau Schätzunge ware staark am Zesummenhang mat der Schätzunge vun engem gëllene Standard traditionell Ëmfro, déi Rwandan versichen a Gesondheet Survey (Dorënner 3.14). Obwuel d'Schätzunge vun der zwou Quellen ähnlech waren, goufen d'Schätzunge vun Blumenstock a Kollegen ronn 50 Mol méi bëlleg an 10 mol méi séier (wann an Käschten wat vun eis Käschten gemooss). Dëst dramatesch Ofsenkung kascht heescht datt anstatt all puer Joer-als Course ginn fir versichen a Gesondheet Ëmfro-d'Hybrid vu klenge Ëmfro kombinéiert mat grouss digitaler Spuer Donnéeën Standard ass kéinten all Mount Course ginn.

Figur 3,13: Sënn vun Blumenstock, Cadamuro, an On (2015). Call Daten aus der Telefonsnummer Firma war fir all Persoun mat engem Stéck zu engem Matrixentgasung ëmgerechent an eng Kolonne fir all Fonktioun (i.e., Variabel). Next, gebaut der Fuerscher engem iwwerwaachten Léieren Model der Ëmfro Äntwerte vun der Persoun, déi vun Fonktioun Matrixentgasung virauszesoen. Dunn, no der Opsiicht Léieren Modell benotzt der Ëmfro Äntwerte fir jiddereen ze impute. An Essenz, benotzt d'Fuerscher d'Äntwerte vun iwwer dausend Leit de Räichtum vun ronn eng Millioun Leit zu impute. Och, multiplizéiert mat der Fuerscher déi geschätzte Plaz vun Residenz fir all 1,5 Millioune Leit baséiert op der Platz vun hir verlaangt. Wann dës zwee Devisen huet kombinéiert-de geschate Räichtum an der geschater Plaz vun Residenz-d'Resultater waren ähnlech ze Schätzunge vun der versichen a Gesondheet Survey, eng Gold-Standard traditionell Ëmfro (Dorënner 3.14).

Figur 3,13: Sënn vun Blumenstock, Cadamuro, and On (2015) . Call Daten aus der Telefonsnummer Firma war fir all Persoun mat engem Stéck zu engem Matrixentgasung ëmgerechent an eng Kolonne fir all Fonktioun (dh, Variabel). Next, gebaut der Fuerscher engem iwwerwaachten Léieren Model der Ëmfro Äntwerte vun der Persoun, déi vun Fonktioun Matrixentgasung virauszesoen. Dunn, no der Opsiicht Léieren Modell benotzt der Ëmfro Äntwerte fir jiddereen ze impute. An Essenz, benotzt d'Fuerscher d'Äntwerte vun iwwer dausend Leit de Räichtum vun ronn eng Millioun Leit zu impute. Och, multiplizéiert mat der Fuerscher déi geschätzte Plaz vun Residenz fir all 1,5 Millioune Leit baséiert op der Platz vun hir verlaangt. Wann dës zwee Devisen huet kombinéiert-de geschate Räichtum an der geschater Plaz vun Residenz-d'Resultater waren ähnlech ze Schätzunge vun der versichen a Gesondheet Survey, eng Gold-Standard traditionell Ëmfro (Dorënner 3.14).

Figur 3,14: Bilan aus Blumenstock, Cadamuro, an On (2015). Um eenzelne-Niveau, goufen d'Fuerscher kënnen eng räsonnabel Aarbecht ze maachen an een d'Räichtum vun hire Opruff records virausgesot. Déi Schätzunge vun Uertschaft-Niveau Räichtum-déi op eenzelne-Niveau Schätzunge vun Räichtum a Plaz vun Residenz-d'Resultater baséiert huet sech gläicht Resultater vum versichen a Gesondheet Survey, eng Gold-Standard traditionell Ëmfro.

Figur 3,14: Bilan aus Blumenstock, Cadamuro, and On (2015) . Um eenzelne-Niveau, goufen d'Fuerscher kënnen eng räsonnabel Aarbecht ze maachen an een d'Räichtum vun hire Opruff records virausgesot. Déi Schätzunge vun Uertschaft-Niveau Räichtum-déi op eenzelne-Niveau Schätzunge vun Räichtum a Plaz vun Residenz-d'Resultater baséiert huet sech gläicht Resultater vum versichen a Gesondheet Survey, eng Gold-Standard traditionell Ëmfro.

An Conclusioun Approche kombinéiert Ëmfro Date mat digital Spuer Donnéeë froen, Blumenstock d'Implikatioune fir Schätzunge vergläichbar mat Gold-Standard Ëmfro Schätzunge produzéieren. Dëst besonnesch Beispill clarifies och e puer vun der Gewerkschaft-Off tëscht Implikatioune froen an traditionnell Ëmfro Methoden. Éischt, goufen d'Implikatioune froen Schätzunge méi virgesinnen, méi bëlleg, a méi käreg. Mä, op der aner Hand, op dës Kéier, ass et net e staarkt theoretesch Basis fir dës Zort vun Implikatioune froen. Dat ass, dat ee Beispill weisen net wann se an wäert Aarbecht wann et net. Weider gesäit d'Implikatioune froen Approche nach net gutt Manéieren hunn zu Onsécherheet ëm hir Schätzung ofgedonkelt. Allerdéngs, Implikatioune froen déif Verbindung zu dräi grouss Regiounen an domatter-Modell-baséiert Post-stratification huet (Little 1993) , imputation (Rubin 2004) , a kleng-Beräich Estimatioun (Rao and Molina 2015) -and sou erwaarden ech dass Fortschrëtt wäert ginn rapid.

Implikatioune froen follegt engem normalen Rezept datt zu Äre besonnesch Situatioun kann. Et ginn zwou Ingredienten an zwee Schrëtt. Déi zwee Ingredienten sinn 1) eng digital Spuer Donnéeën déi breet ass awer dënn (dat ass, dat vill Leit ass awer net d'Informatiounen, déi Dir un all Leit brauchen) an 2) eng Ëmfro déi schmuel ass awer déck (dat ass, et huet nëmmen e puer Leit, mä et ass d'Informatioun, dass Dir un déi Leit brauchen). Dunn, sinn et zwee Schrëtt. Éischt, fir d'Leit an deenen zwou Donnéeën Quellen, bauen eng Maschinn Léieren Modell dass digital Spuer Daten benotzt Ëmfro Äntwerten ze virauszesoen. Next, benotzen deen Modell Maschinn Léieren der Ëmfro Äntwerten vun jidderengem an der digitaler Spuer Donnéeën ze impute. Also, wann et eng Fro, déi Dir bis vill Leit stellen wëllen, kucken fir digital Spuer Donnéeën vun deene Leit, déi gebraucht ginn, kéint hir Äntwert op virauszesoen.

Blumenstock d'éischt an zweet Versuch de Problem vergläichen illustréiert och eng wichteg Lektioun iwwert den Iwwergank vum zweeten Zäitalter zu drëtt Ära Approche Fuerschung zu Ëmfro: Ufank net um Enn ass. Dat ass, oft, déi éischt Approche gëtt net de beschte ginn, mä wann Fuerscher schaffen weider, kann Saache kréien besser. Méi allgemeng, wann an der digitaler Ära nei Approche fir sozial Fuerschung Evaluéieren, ass et wichteg zwou verschidde Evaluatioune ze maachen: 1) wéi och dës Aarbecht elo heescht an 2) wéi och mengt Dir dat an der Zukunft esou d'Donnéeën Landschaft Aarbecht kéinten Ännerungen an als Fuerscher investeiéren, fir de Problem méi Opmierksamkeet. Obwuel, si trainéiert Fuerscher déi éischt Zort vun Evaluatioun ze maachen (wéi gutt ass dëst besonnesch Fuerschungsaarbecht), ass déi zweet oft méi wichteg.