3.4 Wien ze froen

De digitale Alter mécht d'Probabilitéit vun der Probabilitéit an der Praxis méi héicht a schafft nei Méiglechkeete fir keng Probabilitéit.

An der Geschicht vun der Probabilitéit goufen zwee Konkurenzmethoden entwéckelt: Probabilitéitstéierungsmethoden a Wahrscheinlechkeetsproblematik. Obwuel zwou Approche an de fréie Deeg vu Prouf benotzt goufen, ass d'Probabilitéit vun der Wahrscheinlechkeet dominéiert ginn, a vill sozialer Fuerscher ginn geléiert fir d'Probabilitéit vun der Wahrscheinlechkeet mat grousser Skepsis ze gesinn. Awer wéi ech et hei beschreift, ginn d'Verännerungen vum digitale Alter bedeit datt et Zäit ass fir d'Fuerscher ze iwwerpréift fir d'Probabilitéit vun der Wahrscheinlechkeet nozekucken. Besonnesch d'Probabilitéit vun der Probabilitéit ass ëmmer schwéier an der Praxis ze maachen, an d'Probabilitéit vun der Wahrscheinlechkeet ass méi séier, méi bëlleg a besser. Méi séier a bëllege Besoinen sinn net nëmme fir sech selwer: si erméiglechen et nei Méiglechkeete wéi méi häufig Ëmfroen a méi grousser Echometer. Zum Beispill, mat Wahrscheinlechkeete Methoden kann d'Cooperative Congressional Election Study (CCES) ongeféier 10 Mol méi participéieren als fréier Studien, déi Probabilitéit probéieren. Dëst vill méi grouss Sample kann politesch Fuerscher Variant am Hänn a Verhalen vu Ënnergruppen a sozialen Kontexter studéieren. Ausserdeem gouf all dës (Ansolabehere and Rivers 2013) ouni Verloschter bei der Qualitéit vun Schätzungen (Ansolabehere and Rivers 2013) .

Momentan ass déi dominanter Approche fir d'Prouf bei der Soziale Fuerschung d' Probabilitéit fir d'Probabilitéit . An der Wahrscheinlechkeetsproblematik hunn all Membere vun der Zilspopulatioun eng bekannte Nullzuel vu Probebunnen, an all Leit, déi probéieren op d'Ëmfro unzegoen. Wann dës Konditiounen erfëllt sinn, proposéiert elegant mathematesch Resultater provozabel Garancen iwwer d'Fäegkeet vum Fuerscher de Préift ze benotzen fir Affer iwwer d'Zilpopulatioun ze maachen.

An der realer Welt sinn awer d'Konditioune déi dës mathematesch Resultater matgräifen, sinn seelen zimmlech erfaasst. Zum Beispill, et gi oft Ofdeckungsfehler an net respektvoll. Wéinst dës Problemer hunn d'Fuerscher oft eng Rei statistesch Anpassungen ze beschäftegen fir Ennerstëtzung vun hirer Probe op hir Zilpopulatioun ze maachen. Dofir ass et wichteg, tëschent Wahrscheinlechkeetsproblemer an der Theorie ze ënnerscheeden , déi staark theoretesch Garantien a Probabilitéit probéieren an der Praxis , déi keng esou Garancen ubitt an hänkt vu verschiddene statisteschen Upassungen.

Iwwer Zäit sinn d'Differenzen tëscht Wahrscheinlechkeetsproblematik an der Wahrscheinlechkeetsproblematik an der Praxis méi grouss ginn. Zum Beispill, onrepresentéierter Zënsen si méi grouss ginn, och an héichqualitativen, teuren Ëmfroen (3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . D'Netresponse-Tariffer sinn méi héicht an kommerziellen Telefonbeispolien - heiansdo souguer esou héich wéi 90% (Kohut et al. 2012) . Dës Steieren an der Géigerevolutioun bedroht d'Qualitéit vun de Schätzungen, well d'Schätzungen ëmmer méi vun den statisteschen Modeller ofhänken, déi d'Fuerscher benotzt fir un Respekt ze reagéieren. Ausserdeem ginn dës Qualitéit verringert, obwuel si ëmmer méi déier Efforte vun der Ëmfuerderung vun der Ëmfro gemaach gi sinn, fir héich Reaktiounsraten ze behaalen. Verschidde Leit beméien datt dës Zwilling Trends vu manner Qualitéit an Erhéijunge kaschten d'Fundament vun der Surveyforschung (National Research Council 2013) .

3.5: Netresponse war ëmmer méi a stänneg, och a qualitativ héichwäertech Aufgaben (National Research Council 2013, B. D. Meyer, Mok an Sullivan 2015). Netresponse-Tariffer sinn vill méi héich fir kommerziell Telefoner Surveys, heiansdo souguer esou héich wéi 90% (Kohut et al 2012). Dës laangfristeg Trends an der Netresponse bedeit datt d'Datensammlung méi deier gëtt a Schätzungen si manner zouverléisseg. Ofgesat aus B. D. Meyer, Mok an Sullivan (2015), Figur 1.

3.5: Netresponse war ëmmer méi a stänneg, och an héichwäertegen onsecher Ëmfroen (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . Netresponse Tariffer sinn méi héicht fir kommerziell Telefoner Surveys, heiansdo souguer esou héich wéi 90% (Kohut et al. 2012) . Dës laangfristeg Trends an der Netresponse bedeit datt d'Datensammlung méi deier gëtt a Schätzungen si manner zouverléisseg. Ofgesat vu BD Meyer, Mok, and Sullivan (2015) , Figur 1.

Zur selwechter Zäit datt et ëmmer Schwieregkeetsproblemer fir Wahrscheinlechkeetsproblematik ginn ass, gouf et och spannend Entwécklung u Wahrscheinlechkeetsproblematik gewiescht . Et gi verschidde Stile vun Probabilitéit vun Probabilitéit, awer déi Saach, déi se gemeinsam hunn, ass datt se net einfach am mathematesche Kader vun Probabilitéit probéieren (Baker et al. 2013) . An anere Wierder, an der Wahrscheinlechkeetsproblematik net all Mënsch huet eng bekannte Nullzuel vu Wahrscheinlechkeet an Inklusioun. D'Wahrscheinlechkeetsproblematik huet eng schrecklech Ruff tëscht sozialen Fuerscher a si si mat e puer dramatesch Auswierkunge vun Ëmfroen, wéi d' Literarie Digest Fiasco (diskutéiert virdrun) an "Dewey Defeats Truman", déi falsch Virdeeler iwwert d'USA Presidentschaftswale vu 1948 (3,6).

Figure 3.6: President Harry Truman hält d'Iwwerschrëft vun enger Zeitung déi seng Onfait hat falsch verkënnegt. Dës Headliner baséiert deelweis op Schätzungen vun net wahrscheinlech Proben (Mosteller 1949, Bean 1950, Freedman, Pisani, an Purves 2007). Obwuel Dewey Defaatz Truman passéiert ass 1948, ass et nach ëmmer ënnert de Grond datt verschidde Fuerscher skeptesch iwwer Schätz vun Wahrscheinlechkeetsproblemer sinn. Source: Harry S. Truman Library & Museum.

Figure 3.6: President Harry Truman hält d'Iwwerschrëft vun enger Zeitung déi seng Onfait hat falsch verkënnegt. Dës Headliner baséiert deelweis op Schätzungen vun net wahrscheinlech Proben (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . Obwuel "Dewey Defeats Truman" geschitt ass 1948, ass et nach ëmmer ënnert de Grond datt verschidde Fuerscher skeptesch sinn iwwer Schätzungen aus Probabilitéit vun Proben. Source: Harry S. Truman Library & Museum .

Eng Form vun Wahrscheinlechkeetsproblematik, déi besonnesch fir den digitale Alter eegent ass de Gebrauch vun online Panelen . Fuerscher mat online Panelen hänken vun engem gewéinleche Panelsanbieter - normalerweis eng Firma, Regierung oder Universitéit - eng grouss Diversitéit vu Leit ze bauen, déi d'accord as d'Ënnerbeispolitik fir Opfuerderunge sinn. Dës Paneele sinn deelweis mat verschiddene ad hoc Methoden wéi Online Banner Annonceren rekrutéiert. Duerno kann e Fuerscher den Panel Provider fir den Zougang zu enger Probe vun den Interviewten mat gewënschten Charakteristiken bezuelen (zB national repräsentativ fir Erwuessener). Dës online Panelen sinn Wahrscheinlechkeetsmethoden, well net all Mënsch eng bekannte Nullzuel vu Wäerter vun der Inklusioun huet. Obwuel keng Wahrscheinlechkeetsplattform online mat Sozialzwecker benotzt gëtt (zB de CCES), ass et ëmmer nach eng Debatt iwwer d'Qualitéit vun Schätzungen déi aus hinnen kommen (Callegaro et al. 2014) .

Trotz dëser Debatten, denken ech, et ginn zwou Grënn, firwat d'Zäit d'Recht fir sozial Fuerscher un d'Probabilitéit vun der Wahrscheinlechkeetsproblematik ëmzegoen. Éischtens, am Digital Age, sinn et vill Entwécklungen an der Sammlung an Analyse vun Wahrscheinlechkeetsproblemer. Dës méi nei Methoden sinn ënnerscheedlech vun de Methoden, déi Probleemer an der Vergaangenheet verursaacht hunn, datt ech mengen datt et Sënn mécht, als "Probabilitéit net-probabilitéit 2.0" ze denken. Den zweete Grond fir d'Fuerscher d'Unwahrscheinlechkeetsproblematik ze iwwerpréiwen ass, datt Wahrscheinlechkeetsproblematik Praktiken ginn ëmmer méi schwéier. Wann et en héigen Zënssaz vun der Net-Reaktioun ass, well et a Wierklechkeet an der Realerfuerschung sinn - d'tatsächlech Wahrscheinlechkeet vun der Inklusioun vun den Interviewten ass net bekannt, an d'Wahrscheinlechkeetsproblemer a Wahrscheinlechkeetsproblemer sinn net esou ënnerschiddlech wéi vill Fuerscher gläichen.

Wéi ech virdru gesot hunn, sinn net wahrscheinlech d'Probabilitéit mat grousser Skepsis vu villen sozialen Fuerscher gekuckt ginn, deelweis wéinst hirer Roll bei e puer vun de pechendste Fehler an de fréie Deeg vun der Surveillance Recherche. E klore Beispill vu wéi wäit et mat Wahrscheinlechkeetsproblemer komm sinn, ass d'Fuerschung vum Wei Wang, David Rothschild, Sharad Goel an Andrew Gelman (2015) , déi d'Resultater vun de US Wahlen 2012 korrekt erstallt hunn mat engem Wahrscheinlechkeetsprobe vu Amerikanesch Xbox Benotzer - eng enttäuscht nonrandom Probe vun Amerikaner. D'Fuerscher rekrutéiert Interviewpartner aus dem XBox Gaming-System, an wéi Dir eventuell erwaart ass, ass d'Xbox-Muster e bësse männlech a geschnidden jonken: 18- bis 29 Joer alen 19% vun de Wahle sinn awer 65% vun der Xbox Probe a Männer 47% vun de Wahle sinn awer 93% vun der Xbox Probe (3,7). Wéinst dës staark demographesch Biosen, sinn déi roude Xbox-Daten e schlecht Indikateur fir d'Wuer zréck. Si huet eng staark Victoire fir Mitt Romney iwwer Barack Obama virgespillt. Elo ass dëst e Beispill vun de Gefore vu roude, net justifiéiert Wahrscheinlechkeetsproblemer, an erënner wéi d' Literaresch Digest Fiasco.

Figure 3.7: Demografie vun den Interviewten zu W. Wang et al. (2015). Wéinst den Interviewten aus XBox rekrutéiert waren, waren se méi wahrscheinlech méi jonk an méi wahrscheinlech männlech, am Verglach zu de Wieler an der Wahllëscht 2012. Adaptéiert vum W. Wang et al. (2015), Figur 1.

Figure 3.7: Demografie vun den Interviewten zu W. Wang et al. (2015) . Wéinst den Interviewten aus XBox rekrutéiert waren, waren se méi wahrscheinlech méi jonk an méi wahrscheinlech männlech, am Verglach zu de Wieler an der Wahllëscht 2012. Adaptéiert vum W. Wang et al. (2015) , Figur 1.

Wang an Kollegen hu sech awer bewosst datt dës Problemer matenee verspriechen sech fir hiren net-zoustänne Prouf-Prozess unzepassen wann se Schätzungen hunn. Besonnesch hunn se d' Post-Stratifikatioun benotzt , eng Technik, déi och allgemeng benotzt gëtt fir Wahrscheinlechkeetsproblemer z'erreechen, déi Ofdeckungsfehler a keng Äntwert hunn.

D'Haaptidee vun der Post-Stratifikatioun ass d'Hëllef vun der Hëllef vun der Zilspopulatioun fir Hëllef ze verbesseren, déi aus enger Probe kënnt ginn. Wann d'Post-Stratifikatioun benotzt fir Schätzunge vun der Wahrscheinlechkeetsprobe ze maachen, hu Wang a Kollegen d'Bevëlkerung an verschiddene Gruppen ugeschnidden, d'Ënnerstëtzung fir Obama an all Grupp geschätzt an dann eng gewiicht Duerchschnëttsgrupp vun der Grupp Schätzung fir eng Gesamt Schätzung ze produzéieren. Zum Beispill konnten se d'Bevëlkerung an zwee Gruppen (Männer a Fraen) opgedeelt hunn, d'Ënnerstëtzung fir Obama bei Männer a Frae schätzt, a schreift dann allgemeng Ënnerstëtzung fir Obama duerch eng gewiichtend Moyenne fir d'Rechnung ze maachen fir datt Frae maachen 53% vun de Wahle an Männer 47%. Achteren, post-stratifizéierung hëlleft korrekt fir eng onbestrooft Probe, wann Dir Hëllef op d'Gréisst vun de Gruppen ergëtt.

De Schlëssel fir d'Poststratifikatioun ass déi richteg Grupp ze bilden. Wann Dir d'Populatioun an homogene Gruppen uginn huet, sou datt d'Reaktiounsverhënnerungen déi selwecht sinn fir jiddereen an all Grupp, dann post-Stratifikatioun produzéiert onparteilech Schätz. An anere Wierder, post-stratifizéiert duerch Geschlecht wäert onschätzte Schätzungen produzéieren, wann all Männer d'Responsabilitéit hunn an all Frae d'selwecht Reaktiounsopensitéit hunn. Dës Annahme gëtt als Homogenitéit respektéiert Propensitéit - innerhalb vun der Gruppesprooch genannt, an ech beschreiwen et e bësse méi an de mathematesch Noten am Schluss vum Kapitel.

Natierlech, et scheint net wahrscheinlech datt d'Reaktiounsverhënnerungen déi selwecht sinn fir all Männer a fir all Fraen. Allerdéngs ass d'Homogenitéit an d'Reaktiounsapplikatiounen-an d'Ënnergruppenheropfaart méi plausibel wéi d'Zuel vun de Gruppen erhéicht. Achtereg, et gëtt méi einfach, d'Populatioun an homogene Gruppen ze schneiden, wann Dir méi Gruppen grënns. Zum Beispill kann et implausibel sinn datt all Frae déi selwecht Reaktiounsopensitéit hunn, awer et hätt méi plausibel gesinn datt et déi selwecht Reaktiounsopensitéit ass fir all Fraen, déi am Alter vu 18-29 Joer sinn, déi grad vu Collège studéiert hunn, a wien zu Kalifornien wunnen . Esou wéi d'Unzuel vun Gruppen, déi an der Post-Stratifikatioun benotzt ginn, méi grouss gëtt, mussen d'Annuaire benotze fir d'Method ze verstoen. Wéinst dëser Tatsaach sinn d'Fuerscher oft eng immens grouss Grupp vu Post-Stratifikatioun ze kreéieren. Allerdéngs, well d'Zuel vun de Gruppen erhéicht, lafen d'Fuerscher an e verschiddene Problem: Dat Sparsitéit. Wann et nëmmen eng kleng Zuel vu Leit an all Grupp ass, da wäerte d'Schätzungen méi Ongewëss sinn, an am extremen Fall wou et eng Grupp gëtt, déi keng Ënnerbestemmer huet, dann post-Stratifikatioun komplett zerfällt.

Et ginn zwou Weeër aus dëser Spannungsspannung tëscht der Plausibilitéit vun der Homogenitéit an der Reaktiounspropositéit-an der Mëttelpunkt vun der Hypothese an der Demande fir vernifizent Stécksgréissten an all Grupp. Éischt Fuerscher kënnen eng méi grouss a méi ënnerschiddlech Probe sammelen, wat hëlleft mat vernünftleche Stéifsgréissten an all Grupp. Zweetens, si kënne méi e stabile statistesche Modell benotzen fir Schätzungen innerhalb vu Gruppen ze maachen. An tatsächlech, heiansdo Fuerscher si bäi, wéi Wang a Kollegen hunn hir Studie iwwer d'Wahlen mat den Interviewpartneren vun Xbox gemaach.

Well se eng Unwahrscheinlechkeetsproblematik mat Computerverwaltung Interviewen benotzen (ech wäert méi iwwer Computer verwéckte Interviewen am Abschnitt 3.5 schwätzen), hunn Wang an Kollegen eng ganz prekess Datesammlung sammelen, déi se erméiglecht hunn Informatiounen aus 345.858 Unikatter ze sammelen , eng immens grouss Zuel vu Leit vun de Wahle Pollutioun. Dës massive Probe Gréisst huet se eng grouss Zuel vu Poststratifikatiounsprojeten ze bilden. Well d'Post-Stratifikatioun normalerweis d'Populatioun an Honnerte vu Leit gruppert, hunn de Wang an de Kollegen d'Bevëlkerung op 176 256 Gruppen gedeelt (2 Kategorien), Rass (4 Kategorien), Alter (4 Rubriken), Ausbildung (4 Rubriken), (51 Kategorien), Party ID (3 Kategorien), Ideologie (3 Kategorien), an 2008 Vote (3 Kategorien). An anere Wierder, hir grouss Probe-Gréisst, déi duerch eng Low-Cost-Datensammlung aktivéiert gouf, huet se erlaabt eng méi plausibel Hypothie bei hirem Schätzungsprozess ze maachen.

Och mat 345.858 eenzegaartegen Participanten, sinn et nach ëmmer vill, vill Gruppen, fir déi Wang an Kollegen bal keen Interviewten hunn. Dofir hunn se eng Technik genannt Multilevel Regressioun benotzt fir d'Ënnerstëtzung vun all Grupp ze schätzen. Am Prinzip, fir d'Ënnerstëtzung fir Obama innerhalb enger spezifescher Grupp ze schätzen, huet d'Multilevel-Regressioun d'Informatioun vu ville mateneen verbannen. Zum Beispill, sech virzestellen versicht d'Ënnerstëtzung fir Obama ënnert weiblechen Hispaneschen tëscht 18 an 29 Joer al ze schätzen, déi Hochschoulen, déi Demokratie registréiert hunn, déi sech als Moderaten identifizéieren an déi gewielt fir 2008 am Obama. Dëst ass eng ganz , ganz spezifesch Grupp, an et ass méiglech, datt et kee bei der Probe mat dëse Charakteristiken gëtt. Dofir, fir Schätzungen iwwer dës Grupp z'ernimmen, benotzt d'Multilevel-Regressioun e statistescht Modell fir zesummen d'Schätzung vu Leit an ganz ähnleche Gruppen zesummenzelen.

Wang an Kollegen hunn dofir eng Approche benotzt déi d'Kombinéiere vun der Multilevel-Regressioun an der Post-Stratifikatioun kombinéiert huet, fir datt se hir Strategie- Multilevel-Regressioun mat Post-Stratifikatioun oder méi séngen "Här P. "Wann de Wang an d'Kollegen de P. P. fir Schätzunge vun der XBox-Wahrscheinlechkeetsprobe benotzt hunn, hunn se Schätzungen ganz no bei der allgemenger Supportfirma produzéiert, den Obama an de Wahlen 2012 kritt huet (3,8). Tatsächlech waren hir Schätzungen méi genee wéi e Aggregatz vun traditionelle ëffentlech Meenung pollen. Also, an dësem Fall, sinn statistesch Anpassen, virun allem Här P.-d'Geleeënheet, eng gutt Aarbecht ze maachen, déi d'Biasis an de Wahrscheinlechkeetsdaten korrigéiert; Biosen déi kloer sichtbar waren, wann Dir d'Schätzunge vun den net ugepasst Xbox Daten kucke.

Figure 3.8: Schätzungen vum W. Wang et al. (2015). Onofhängeg XBox-Probe produzéiert ongerecht Schätzungen. Awer d'gewichtte XBox-Probe produzéiert Schätz, déi méi genee wéi en duerchschnëttlech Wahrscheinlechkeets-baséiert Televisiounsanalyse waren. Adaptéiert vum W. Wang et al. (2015), Figuren 2 an 3.

Figure 3.8: Schätzungen vum W. Wang et al. (2015) . Onofhängeg XBox-Probe produzéiert ongerecht Schätzungen. Awer d'gewichtte XBox-Probe produzéiert Schätz, déi méi genee wéi en duerchschnëttlech Wahrscheinlechkeets-baséiert Televisiounsanalyse waren. Adaptéiert vum W. Wang et al. (2015) , Figuren 2 an 3.

Et ginn zwou Haaptstonne vun der Wang an de Kollegen. Déi éischt net agegläizent Wahrscheinlechkeetsproblemer kënnen zu schlecht Schätzungen zoustëmmen. Dëst ass eng Lektioun datt vill Fuerscher virun éischter héieren hunn. Déi zweet Lektioun ass awer datt d'Netwahrscheinlechkeetsproblemer, wann se richteg richteg analyséieren, tatsächlech gutt Schätz u produzéieren; Net Wahrscheinlechkeetsproblemer brauchen net automatesch eppes wéi d' Literaresch Digest Fiasco ze féieren.

Wann Dir versicht d'Entscheedung tëschent Probabiliséierungsproblemer a engem Wahrscheinlechkeetsproblem ze entscheeden, deen Dir eng schwiereg Wiel auswielen. Heiansdo wëllen d'Fuerscher eng schnell a strenge Regel (z. B. ëmmer Wahrscheinlechkeetsprobenmethoden) benotzen, awer et ass ëmmer méi schwéier esou eng Regel ze bidden. D'Fuerscher stellen eng schwiereg Wiel tëschent Wahrscheinlechkeetsproblematik an der Praxis - déi ëmmer méi teuer an wäit vun den theoreteschen Resultater konfrontéiert sinn, déi hir Gebrauch- a Wahrscheinlechkeetsproblematik rechtzeechen - déi méi bëlleg a méi schnell sinn, awer manner vertraut a méi variéiert. Eng Saach, déi kloer ass, ass awer datt wann Dir gezwongen ass mat net wahrscheinlech Probabel oder net repräsentativ grouss Datenquellen ze schaffen (kuckt ierch Kapitel 2), da besteet e staarkt Grond fir ze gleewen, datt Schätzungen mat der Post-Stratifikatioun an Technesch Mëttelen ginn besser wéi net justifiéiert, roude Schätz.