3.6.2 Amplified

Amplifizéiert frot een e Prädiktiv Modell fir d'Ëmfro vun Daten aus e puer Leit mat enger grousser Datenquelle aus ville Leit verbënnt.

Eng aner Manéier fir d'Ëmfro an d'Kombinatioun vu groussen Datenquellen ze verbannen ass e Prozess deen ech verstäerkt fraen . An enger verstäerkt Ufro un engem Fuerscher benotzt en prädiktiven Modell fir eng kleng Quantitéit vun Ëmfragendaten ze kombinéieren mat enger grousser Datenquelle, fir Schätzungen zu enger Skala oder Kärkraaft ze produzéieren déi net individuell mat enger Datenquell méiglech sinn. E wichtegt Beispill vum verstäerkt Erfrëschung ass vun der Aarbecht vum Joshua Blumenstock, déi Daten sammelen, déi d'Entwécklung an Aarmer Länner hëllefen kënnen hëllefen. An der Vergaangenheet haten d'Fuerscher dës Donnée vun Donnéeën normalerweis ee vun zwee Approche ze huelen: Probe-Untersuchungen oder Zensiounen. Beispiller vun Ëmfroen, wou Fuerscher interviewt eng kleng Unzuel vu Leit, kënne flexibel, rechtzäiteg a relativ preiswert sinn. Allerdéngs sinn dës Uersaachen, well se op enger Probe baséieren, oft an hirer Resolutioun limitéiert. Mat enger Assoziéierungserhebung ass et oft schwéier, Schätzungen iwwer spezifesch geographesch Regiounen oder fir spezifesch demographesch Gruppen ze maachen. Censuses, op der anerer Säit, versicht all zesummen ze interviewen, sou datt se benotzt kënne fir Schätzungen fir kleng geographesch Regiounen oder demographesch Gruppen z'erreechen. Mä Censusë sinn normalerweis deier, schmuel am Fokus (se nëmmen eng kleng Froe stellen), an net ze froe (si passen op engem fixe Plang, wéi all 10 Joer) (Kish 1979) . Anstatt mat Stéierbeispolien oder Zensiounen ze stecken, sech virstellen, ob d'Fuerscher déi bescht Charakteristike vun deenen zwee verbannen. Stellt Iech vir, ob d'Fuerscher all Fro op all Mënsch all Dag froen. Natiirlech ass dës onbeständeg, ëmmer op der Ëmfroung eng Art sozialer Wëssenschaft. Awer et ass iewewend datt mer ufänken ze begleeden , andeems d'Ëmfroen Froen aus enger gerengerer Zuel vu Leit mat digitale Spuren vun villen Leit verbannen.

D'Forschung vu Blumenstock huet ugefaangen, wann hie mat dem gréissten Handyapparater an Rwanda geschafft huet. D'Firma huet anonym Betribsgesetzer vun ongeféier 1,5 Millioune Clienten tëschent 2005 an 2009 gemaach. Dës Ënnersetzungen enthale Informatiounen iwwer all Ruffeeler an SMS, wéi d'Startzäit, Dauer , an ongefier geografesch Positioun vum Anrufer an den Empfänger. Virun wat ech iwwer d'statistesch Froe schwätzen, ass et ze vermëttelen, datt dee éischte Schrëtt fir ee vun den härsten fir vill Fuerscher sinn. Wéi ech am Kapitel 2 beschriwwe ginn, sinn déi meescht grouss Datenquelle fir Fuerscher unzegoen . Meta-Datebank, besonnesch besonnesch, ass besonnesch net accessibel, well et grondsätzlech net anonymiséierbar ass an et ass bal natierlech Informatioun dass d'Participanten sensibel sinn (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . An dësem besonneschen Fall waren d'Fuerscher vläicht vervollstänneg fir d'Donnéeë ze schützen an hir Aarbecht gouf vun engem Drëtten iwwersat (dh hir IRB). Ech wäert dës ethesch Problemer am Kapitel 6 méi detailléieren.

Blumenstock war interesséiert fir Räich a Wuelbefannen. Awer dës Charaktere sinn net direkt am Ruff Rekorder. An anere Wierder, dës Call Records ginn onofhängeg fir dës Fuerschung - eng gemeinsam Feature vu groussen Datenquellen, déi am Kapitel 2 am Detail diskutéiert gouf. Allerdings ass et wahrscheinlech datt d'Ruff Rekorder wahrscheinlech e puer Informatiounen hunn, déi indirekt Informatiounen iwwer Räich a Wuelbefannen. Wann dës Possibilitéit gefält, huet d'Blumenstock gefrot ob et méiglech war, e Maschinnmodell ze trainéieren, fir z'erklären, wéi een op en Ëmfank op senger Ukënnegkeete reagéiert. Wann dat méiglech war, konnt d'Blumenstock dëse Modell benotzen fir d'Ëmfro vun Iwwerleeunge vun all 1,5 Milliounen Clienten ze prediéiren.

Fir e Modell ze bauen an ze trainéieren, hunn d'Blumenstock an d'Fuerscher vun dem Kigali Institut fir Wëssenschaft an Technologie eng random Probe vun ongeféier tausend Clienten genannt. D'Fuerscher erklärt d'Ziler vum Projet un de Participanten, gefuerdert fir hir Zoustëmmung fir d'Ëmfro-Responsen op d'Ruff Rekommandéieren ze verbannen an dann eng Rei vu Froen ze stellen fir hiren Wuerts- a Wuelbefannen wéi "Maacht Iech eegent Radio? "an" Hutt Dir e Vëlo? "(kuckt Bild 3.14 fir eng deelweis Lëscht). All d'Participanten an der Ëmfro waren finanziell kompenséiert.

Niewendrun hunn d'Blumenstock eng zweet Schrëtt verfaalen, déi am Maschinn léieren: Feinentechnologie mat bestëmmte Léierpersonal. Éischtens, am Feature-Ingenieursschrëtt , fir jiddereen, deen interviewt gouf, huet d'Blumenstock d'Call Records an eng Rei vun Charakteristiken iwwer all Persoun ëmgewandelt; D'Wëssenschaftler kënnen dës Charakteristike "Features" nennen, an d'Sozialwëssenschaftler wäerten se "Variablen" nennen. Zum Beispill, fir all Persoun, d'Blumenstock berechtegt d'Gesamtzuel vun Deeg mat Aktivitéit, d'Zuel vun de verschiddene Leit eng Persoun an der Kontakt war D'Zuel vu Suen, déi op Dier fortgesat goufen, a sou weider. Kritesch ass e gudde Feature-Ingenieur erfuerderlech Kenntnisser iwwert d'Fuerschung. Zum Beispill, wann et wichteg ass, fir intern oder internationale Uriff ze ënnerscheeden (mir kënnen u Leit déi international opruffen fir méi räich) ze kënnen, da muss dat am Feature-Ingenieursschrëtt gemaach ginn. En Fuerscher mat wéineg Verständnis vu Rwanda kéint dës Funktioun net beweegen, a da wier d'Prévisivitéit vum Model leiden.

Niewendrun hunn an der Kontroll vun der Léierpersonal Blumenstock e Modell entwéckelt fir d'Opféierung vun der Ëmfro fir all Persoun, déi op hir Funktiounen baséiert. An dësem Fall huet d'Blumenstock logistesch Regressioun benotzt, awer hie kéint eng Rei aner statistesch oder Maschinn léieren.

Also wéi ass et geschafft? War d'Blumenstock d'Äntwerten op Ufro fir Froen ze probéieren wéi "Hutt Dir e Radio?" A "Hutt Dir e Vëlo?" Benotzt Benotzung vun Ofrufaktioune? Fir d'Leeschtungsfähegkeet vu sengem Préedictivmodell ze evaluéieren, benotzt d'Blumenstock d' Cross-Validatioun , eng Technik déi allgemeng benotzt gëtt fir Datenwëssenschaft, awer selten an der Sozialwëssenschaft. D'Zilsetzung vun der Kredittadaptatioun ass eng fair Beurdeelung vun engem präzisivt Virdeel vun engem Modell ze léieren andeems en et op verschiddene Subsets vun Daten eraussicht. Besonnesch huet d'Blumenstock seng Donnéeën an 10 Stécker vun 100 Persounen opgedeelt. Dann huet hien néng vu de Stécker benotzt fir säin Modell ze trainéieren, an d'préiftiv Performance vun der geschulte Modell gouf am vergaangene Käer beurteelt. Hien huet dës Prozedur 10 Mol ëmgedeeft - mat all eenzel Stonn vun Donnéeën kritt een d'Dreck wéi d'Validatiouns-Donnéeën - a gemittlech d'Resultater.

D'Genauegkeet vun de Prognosen war héich fir verschidden Züge (Bild 3.14); Beispill Blumenstock konnt mat 97,6% Genauegkeet virstellen, wann ee mat engem Radio gehéieren. Dëst kléngt beandrockend, awer et ass ëmmer wichteg fir eng komplex Prädiktiounsmethod géint eng einfach Alternativ ze vergläichen. An dësem Fall ass eng einfach Alternativ fir ze prediéieren datt jiddereen déi allgemeng Äntwert gëtt. Zum Beispill, 97,3% vun den Interviewten hunn e Radio ze besuergen, wann d'Blumenstock virgeschloen huet, datt jiddereen iwwer e Radio héieren hätt, deen e Genauegkeet vun 97,3% hätt, wat iwwerraschend wéi seng Performance méi komplizéiert ass (97,6% Genauegkeet) . An anere Wierder hunn all dës Phantasie a Modelléierunge d'Genauegkeet vun der Prognosioun vun 97,3% op 97,6% erhéicht. Awer fir aner Froen, wéi zB "Fannt Dir e Vëlo?", Hunn d'Prognosen verbessert vun 54,4% op 67,6%. Am Allgemengen erkläert d'Figur 3.15, datt e puer Traiteen Blumenstock net vill méi wäit wéi déi einfache Baseline Prognos gemaach huet, awer dat fir aner Zichzäit war eng Verbesserung. Wann Dir just op dësen Resultater kuckt, kënnt Dir eventuell net denken datt dës Approche besonnesch versprécht.

Figure 3.14: Prädiktiv Genauegkeet fir e statistesche Modell mat Zuchaccidenten trainéiert. Ausgestalt aus Blumenstock (2014), Dësch 2.

Figure 3.14: Prädiktiv Genauegkeet fir e statistesche Modell mat Zuchaccidenten trainéiert. Ausgestalt aus Blumenstock (2014) , Dësch 2.

Figure 3.15: Verglach vu prognostizéiert Genauegkeet fir e statistescht Modell mat Zuchaccidenten op einfache Baseline Prognos. Punkten si liicht verwackelt fir Iwwerdréint ze vermeiden. Ausgestalt aus Blumenstock (2014), Dësch 2.

Figure 3.15: Verglach vu prognostizéiert Genauegkeet fir e statistescht Modell mat Zuchaccidenten op einfache Baseline Prognos. Punkten si liicht verwackelt fir Iwwerdréint ze vermeiden. Ausgestalt aus Blumenstock (2014) , Dësch 2.

Awer nëmmen ee Joer méi spéit, Blumenstock an zwee Kollegen Gabriel Cadamuro an Robert On-publizéiert e Pabeier an der Wëssenschaft mat wesentlech besseren Resultater (Blumenstock, Cadamuro, and On 2015) . Et waren zwee haaptsächlech technesch Ursaachen fir dës Verbesserung: (1) Si hunn méi opgereegte Methoden benotzt (dh eng nei Approche fir Ingenieurswiesen an e méi modernen Modell fir Viruerunge vu Fonktiounen ze préviséieren) an (2) anstatt wéi et probéiert huet, Umfragungsfroen (zB "Hutt Dir e Radio?"), versicht et, de Composite- Rees Index ze schafen. Dës technesch Verbesserunge bedeit datt et eng vernoléis Aarbecht wier ze maachen an Telefonsgesécher ze maachen fir de Wuelstand fir d'Leit an hirer Préift ze predigéieren.

De Prestigen vum Räich vu Leit an der Probe war awer net d'ultimativ Ziel vun der Fuerschung. Vergiesst net datt d'ultimativ Ziel ass e puer vun de beschten Charakteristiken vun de Probe-Ëmfroen a Censuses ze kombinéieren fir präziséiert High-Resolutionen vun der Aarmut an den Entwécklungslänner ze produzéieren. Fir hir Fäegkeet ze bemierknen dëst Zil z'erreechen, hunn d'Blumenstock an d'Kollegen hiren Modell a seng Daten benotzt fir de Rees vun all 1.5 Millioune Leit an de Ruff Rekorder ze prediéieren. A si benotzt d'Geospatialinformatioun an de Ruffzeechen (Erënnerung datt d'Donnéeën de Standpunkt vum nächsten Zelltuerm fir all Ruf) inkludéieren de ongepasste Wunnsëtz vun all Persoun (Bild 3.17). Déi zwéin Schätzungen zesummegesat, Blumenstock a Kollegen hunn eng Schätzung vun der geographescher Verdeelung vun de Wënzer an der extremer räicher räicher Granularitéit. Zum Beispill konnten se de Duerchschnëttswäert an all Rwanda 2,148 Zellen (déi klengste Verwaltungseinheit am Land) schätzen.

Wéi gutt sinn dës Schätz mat der aktueller Armut vun dëse Regiounen iwwerholl? Virun dëser Äntwert äntweren ech, datt et vill Grënn sinn skeptesch. Zum Beispill, d'Fäegkeet, Virdeeler op der individueller Basis ze maachen, war zimlech lauter (Bild 3.17). An, vläicht méi wichteg, Leit mat Mobiltelefonen kënnen systematesch anescht wéi Leit ouni Mobiltelefon sinn. Awer d'Blumenstock a Kollegen kënne leiden aus den Typen vun Ofdeckungsfehler, déi d'1936 Literariver Digest- Ëmféierung virbereet hunn , déi ech virdru scho gesot hunn.

Fir e Sënn vun der Qualitéit vun hire Schätzungen ze kréien, hunn d'Blumenstock an d'Kollegen se mat eppes aner ze vergläichen. Glécklech, ongeféier gläichzäiteg wéi hir Studie, eng aner Gruppe vu Wëssenschaftler eng méi traditionell sozial Ëmfro an Rwanda gemaach huet. Dës aner Ëmfro, déi Deel vum breet respektéierte Demografie a Gesondheetssécherungsprogramm war, huet e groussen Budget an haaptsächlech qualitativ héichwäerteg, traditionell Methoden benotzt. D'Schätzunge vun der Demografie an de Gesondheetssécherung kënnen dofir als viraussiichtlech Schätzungen vun Goldstandard betraff sinn. Wann déi zwee Schätzungen verglach woren, sinn se ganz ähnlech (3,11). An anere Wierder, duerch Kombinéiere vu kleng Summerservéierendaten mat de Gespréicher, Blumenstock a Kollegen konnten Estimatioune produzéieren, déi ähnlech sinn wéi déi vu Gold-Standard Approche.

E Skeptiker kéint dës Resultater als Enttäuschung gesinn. Nodeems alles een se se gesinn huet, ass et ze soen datt duerch d'Verwäertung vu groussen Daten an de Maschinn, d'Blumenstock an d'Kollegen konnten Schätzungen produzéieren, déi méi vu reliéise vu existent Methoden gemaat ginn. Mee ech denken net dat ass de richteg Wee fir dës Studie aus zwee Grënn ze denken. Éischt ass d'Schätzung vun Blumenstock a Kollegen ongeféier 10 Mol méi schnell a 50 Mol méi bëlleg (wann d'Käschte mat variabel Käschten gemooss ginn). Wéi ech virdru schonn an dësem Kapitel diskutéiert hunn, ignoréiere d'Käschte op hir Geeschter ignoréieren. An dësem Fall, zum Beispill, d'dramatesch Verloscht vu Käschten heescht dat, anstatt all puer Joer - wéi et Standard fir Demographesch an Gesondheetsbericht ass - dës Art Ofstëmme all Mount kënne lafen, wat vill verschidde Virdeeler fir d'Fuerscher an d'Politik Leit. Déi zweetmoosseg Ursaach fir d'Skepsis net ze kucken, datt dës Studie en Basisrezept léisst, dee fir vill verschidde Fuerschungssituatiounen ugepasst kënne ginn. Dësen Rezept huet nëmmen zwou Zutaten an zwee Schrëtt. D'Ingrediente sinn (1) eng grouss Datenquelle déi breed awer dënn ass (dh et huet vill Leit, awer net déi Informatioun déi Dir iwwer all Persoun brauche soll) a (2) eng Ëmfrage déi eng eng déck ass (dh datt et nëmmen e puer Leit, awer et huet d'Informatioun, déi Dir braucht iwwer déi Leit). Dës Zutaten ginn dann an zwou Schrëtt kombinéiert. Als éischt, fir d'Leit an deenen zwou Datenquellen baut en Maschinnmodell opzebauen, deen déi grouss Datenquelle benotzt fir Pollueur Antworten ze prophetéieren. Niewt dem Modell, fir d'Ëmfro Äntwerten fir jiddereen an der grousser Datenquelle anzegoen. Also, wann et e puer Fro gëtt, datt Dir vill Leit wëllt froen, kucke fir eng grouss Datenquelle vun deene Leit déi benotzt kënne ginn fir hir Äntwert z'ënnerhuelen, och wann Dir net iwwer déi grouss Datenquelle këmmert . Dat heescht, d'Blumenstock an d'Kollegen hunn net séngen Sorgen iwwer Telefonsgespräicher; Si hunn nëmmen iwwer Ruf Rekorder ze këmmeren, well se benotzt kënne fir Viruerdefnungen ze vermëttelen, déi si betreffen. Dëst charakteristescht-indirekt indirekt Interesse an der grousser Datenquelle mécht d'Amplifizitéit an anert anerem vun der embedded Fuerderung, déi ech virdru scho gesot hunn.

Figure 3.16: Schema vun der Studie vu Blumenstock, Cadamuro, an A (2015). Ruffzuelen vun der Firma telefonéiert sech ëm eng Matrix mat enger Zeil fir all Persoun an eng Spalte fir all Feature (z. Als nächstes hunn d'Fuerscher en kontrolléiert Léierméiglechkeet gebaut fir d'Ëmfro vun der Ëmfro vu de Matrix-Matrix ze predictéieren. Duerno gouf den iwwerwaachte Léiermodell benotzt fir d'Ëmfro-Responsen fir all 1,5 Millioune Clienten ze beschäftegen. Och d'Wëssenschaftler schätzt d'ongerecht Plaz vum Residenz fir all 1,5 Milliounen Clienten op Basis vun de Plazen vun hiren Appellen. Wann dës zwou Schätzungen - de geschätzte Räich an de geschätzte Plaz vu Residenz - kombinéiert goufen, sinn d'Resultater ähnlech wéi Schätzungen aus der Demografie an der Gesondheetskeess, eng gold-standard Traditioun (Fra 3.17).

Figure 3.16: Schema vun der Studie vu Blumenstock, Cadamuro, and On (2015) . Ruffzuelen vun der Firma telefonéieren ëmgeleet op eng Matrix mat enger Zeil fir all Persoun an eng Spalte fir all Feature (dh variabel). Als nächstes hunn d'Fuerscher en kontrolléiert Léierméiglechkeet gebaut fir d'Ëmfro vun der Ëmfro vu de Matrix-Matrix ze predictéieren. Duerno gouf den iwwerwaachte Léiermodell benotzt fir d'Ëmfro-Responsen fir all 1,5 Millioune Clienten ze beschäftegen. Och d'Wëssenschaftler schätzt d'ongerecht Plaz vum Residenz fir all 1,5 Milliounen Clienten op Basis vun de Plazen vun hiren Appellen. Wann dës zwou Schätzungen - de geschätzte Räich an de geschätzte Plaz vu Residenz - kombinéiert goufen, sinn d'Resultater ähnlech wéi Schätzungen aus der Demografie a Gesondheetssécherung, eng Gold Standard Traditiounsgefaang (Abbildung 3.17).

Figure 3.17: Resultater vun Blumenstock, Cadamuro, A (2015). Op individuellem Niveau konnte sech d'Fuerscher vernoléissegen Aarbecht maachen fir de Räich vu jiddem Ruf ze predictéieren. D'Schätzungen vum Räichwahlstanduert vun de Rwanda aus 30 Distrikter - déi op Schätzungen vum Räich a Residenzplaz vun eenzelnen Niveau baséiert sinn ähnlech wéi Resultater vun der Demografie a Gesondheetssécherung, eng traditionell Gold-Standard Traditioun. Am Adaptatioun aus Blumenstock, Cadamuro, an On (2015), de Figuren 1a a 3c.

Figure 3.17: Resultater vun Blumenstock, Cadamuro, and On (2015) . Op individuellem Niveau konnte sech d'Fuerscher vernoléissegen Aarbecht maachen fir de Räich vu jiddem Ruf ze predictéieren. D'Schätzungen vum Räichwahlstanduert vun de Rwanda aus 30 Distrikter - déi op Schätzungen vum Räich a Residenzplaz vun eenzelnen Niveau baséiert sinn ähnlech wéi Resultater vun der Demografie a Gesondheetssécherung, eng traditionell Gold-Standard Traditioun. Am Adaptatioun aus Blumenstock, Cadamuro, and On (2015) , de Figuren 1a a 3c.

Schlussendlech hunn d'Blumenstock amplifizéiert Asking Approche kombinéiert Summchtenddaten mat enger grousser Datenquelle fir Schätzfäegkeeten ze vergleichen, déi ähnlech sinn wéi déi aus enger Gold-Standard-Ëmfro. Dëst spezifescht Beispill erméiglecht och e puer vun den Handelsbezeechnungen vun enger verstäerkt a frëndlecher Ëmféierung. Déi verstäerkt Schëffer froen zejoert waren méi fréi, erheblech méi bëlleg, a méi käregulär. Mä op där anerer Säit ass et nach net eng staark theoretesch Basis fir dës Zort vun der verstäerkt Bitten. Dëst eenzegt Beispill weist net wann dës Approche funktionnéiert a wann et net wäert sinn, an d'Fuerscher déi dës Approche benotze mussen besonnesch Besonnesch u Meenungen iwwer Virbereedungen déi duerch eng verstäerkt ginn - a wa se net mat grousser Datenquelle verëffentlecht ginn. Den verstärkten Fraen Approche huet nach ëmmer keng gutt Weeër fir d'Ongewëssheet ëm seng Schätz ze quantifizéieren. Glécklecherweis huet de verstäerkt Erfrëschung eng staark Verbindung mat dräi grousser Gebitt an der Statistik-Skizzenabschätzung (Rao and Molina 2015) , der Imputatioun (Rubin 2004) , an der modellbaséierter Post-Stratifikatioun (déi selwer eng mat P., d'Methode, déi ech virdru am Kapitel beschreift) (Little 1993) . Wéinst dës Deep Connections, ech erwaarden datt vill vun den methodeschen Grënnungen vun enger verstäerkt Ufro bëfter verbessert ginn.

Schliissend, wéi de Blumenstock seng éischt an zweeter Versuch vergläicht, illustréiert och eng wichteg Lektioun iwwert d'digitale Sozialzéiung: den Ufank ass net de Schluss. Dat ass, véiermol, déi éischt Approche wäerte net déi bescht sinn, mä wann d'Fuerscher weider schaffen, kann d'Aarbecht besser ginn. Am Allgemengen, wann d'Evaluatioun vun neie Approche fir Sozialfuerschung am Digital Alter ass, ass et wichteg, zwou verschidde Evaluatioune maachen ze maachen: (1) Wéi gutt funktionnéiert dëst elo? a (2) Wéi gutt funktionnéiert dës Aarbecht an Zukunft als d'Datenlandschaft ändert an als Fuerscher méi Opmierksamkeet op déi Fro stellen? Obwuel d'Fuerscher geschat ginn fir déi éischt Aart vun Evaluatioun ze maachen, ass déi zweet méi oft wichteg.