3.4 Quale à dumandà à

L'età di l'età digitale fa furmatu u probabilitati in a pratica più difficili è si crea una novi oportunità per u probimentu senza probabilità.

In a storia di u prucedimentu, ci sò stati dui cuncurrencisi: metudi di probabilitati è metudi di prupositu non-probabilisticu. Eppuru chì l'avvicinamenti foru usati in i primi tempi di u prucedimentu, u probimentu d'probezza hà vinutu per dominaru, è parechji miràzii suciali anu studiatu à vede un sampling senza probabilità cù un gran escepticismo. In ogni modu, cum'è discurriraghju sottu, cambiamenti creati da l'era digitale volenu chì ghjè u tempu per i ricchieri in riaccumulate non-probability sampling. In particulare, probabilità di pigliatu hà fattu crescita di fà in a prublema, è micca di probabilità chì u mutazione hè stata rapida, più prezzu, è megliu. L'enversi più veloce è ricchi ùn sò micca finamente ghjudicate in elli: permetteranu novi oportunità, per esempii più frequenti è e più maiori di mostra. Per esempiu, aduprate micca di prublemi di probabilitati, u Strumentu di Cungistramentu di Cungressu Cooperativu (CCES) ponu avè qualchì 10 voti più participanti cum'è studii pricidenti cù probabilità di scanning. Questa dimarchja più grande permette chì i furmazioni pulitichi puderanu studià a variazione in attitudini è cumportamentu in i sottogruppi è i cuntratti suciali. Cumplementu, tutta sta scala agghiunea venenu senza minimizazioni in a qualità di estimi (Ansolabehere and Rivers 2013) .

Oghje, l'approcciu dominante à u munetagliu per a ricerca sociale hè un probabilitate di mostra . In u probimentu probabili, tutti i membri di a populazione di destinazione anu una probabilita sapissera, non cero di esse tastata, è tutte e persone chì anu pigliatu mostra risponde à l'indagine. Quandu sti cundizioni sò scritti, risultati matematii eleganti prupone garantìbile per l'abilità di l'investigatore per utilizà a mostra per fà inferenzi nantu à a destinazione pupulazione.

In u mondu reale, però, i cundizzioni sottumessi i risultati matematiè chì raramente sò. Per esempiu, sò parechje spessu i pagamenti di a cobertura è ùn anu rispusendu. Per via di sti prublemi, i ricerchi anu spessu appiegatu una varietà di reguli statistiche per fà infertilità da a so mostra à a so populazione chjamata. Cusì, hè impurtante distinguishà da a probabilità è u prucedimentu in a teoria , chì hà assai garanzii teorichi forti è a probabilità di scanning in a pràtica , chì ùn prupone nisuna garantizia è dipende à una varietà di reguli statistici.

À u tempu, i probidienze di probabilità in a teoria è a probabilitati di u sampling in a practica anu crescente. Per esempiu, i valori di risposti ùn anu sviluppatu sempri, ancu in enucenzii caru di qualità, di costu (figura 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . I risultati di micca risposta sò assai più altu in i venti di telefonii cummerciale, à volte ancu à u 90% (Kohut et al. 2012) . Queste aumenta in nonresponse amminazza a qualità di estimi perchè l'estimi addiventanu dipende di i mudeli statistici chì i furmaturi utilizanu per l'aghjustà per nonresponse. In più, queste diminuite di qualità anu succorsu pese à l'urganisimu lottu di i persunalizati per i principianti per mantene e risposti altu risposti Certi parsoni teme chì e sti biulogica di a diminuità di a qualità è creanu custu custituiscenu a fundazione di a ricerca di storia (National Research Council 2013) .

Figura 3.5: Nonresponse hè statu sempri u cuntribuzione, ancu in i sughjimi carchi di qualità (National Research Council 2013; B. D. Meyer, Mok, è Sullivan 2015). I risultati di micca risposta sò assai più altu per i venti di telefonii cummirciali, à volte ancu altri u 90% (Kohut et al., 2012). Sti tendenzi longu in nonresponse significanu chì a recopilazione di dati hè più caru è estimi sò menu affidate. Adattazione di B. D. Meyer, Mok, è Sullivan (2015), figura 1.

Figura 3.5: Nonresponse hè statu sempri u cuntribuzione, ancu in i sughjimi carchi di qualità (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . I risultati di micca risposta sò assai più altu per i venti di telefonii cummirciali, à volte ancu altri u 90% (Kohut et al. 2012) . Sti tendenzi longu in nonresponse significanu chì a recopilazione di dati hè più caru è estimi sò menu affidate. Adattazione di BD Meyer, Mok, and Sullivan (2015) , figura 1.

À u listessu tempu chì ci hè statu prublema di difficultà per i metudi di probabilitati, anu anch'ellu hè statu ancu cuncipitu interessanti in metudi di prupositu non-probabilisticu . Ci hè una varietà di stili di mettei di prupositu non-probabilisticu, ma l'una cosa chì anu in cumuni hè chì ùn pò micca prontule facilmente in u framework matimàticu di probabilità di u dispunimentu (Baker et al. 2013) . In altri palori, in non-probabilitati metudi di pruvista ùn tutti ùn anu una probabilita sapissera è nonzero d'inclusión. Ùn sò pruprietà di probabilità in probabilità sò una terribura reputazione in i culligaturi sociale è sò assuciati cun qualche di i più dramatichi falluti di i investigatori di a scuperta, cum'è u fiasco di Scorsese Literatu (discuttu prima) è "Dewey Trovati Truman", a predizioni incorrecta à i Stati Uniti elezzione presidenziale di u 1948 (figura 3.6).

Figura 3.6: U presidente Harry Truman sustene u principale di un ghjurnale chì avia annunziatu a so scunfitta. Sta titulazione hè stata basatu nantu à stimi per esempii di non probabilitati (Mosteller 1949; Bean 1950; Freedman, Pisani è Purves 2007). Ancu Dewey Derimanteghja Truman hè accadutu in u 1948, hè ancu trà u mutivu chì certi investigatori sò scettichi nantu à stimi da esempii di probabilitati. Source: Harry S. Truman Library & Museum.

Figura 3.6: U presidente Harry Truman sustene u principale di un ghjurnale chì avia annunziatu a so scunfitta. Sta titulazione hè stata basatu nantu à stimi per esempii di non probabilitati (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . Invechjate "Dewey Defeats Truman" ghjè accadutu in u 1948, hè ancu trà u mutivu chì certi certi investigaturi sò scettichi nantu à stimi per esempi di non probabilitati. Source: Harry S. Truman Library & Museum .

Una forma di probazione senza probabilità chì hè particulari adattatu à l'era digitale hè l'utilizazione di pannelli on line . I ricchieri chì utilizanu panei online dependenu di qualchì prugramu prugramu-usualmente una sucità, guvernu, o univirsità-per custruisce un grande è diversu gruppu di persone chì accunsenu à serve com'è i rispondenu per i medizzioni. Queste participanti di u pannelli sò spessu recruati utilizandu una varietà di metudi ad hoc, cum'è i bandi online. Allora, un ricerca pò pagà u prove di pannellu per accessu à una mostra di rispondenti cù e caratteristiche aspettavuli (per esempiu, naziunale rappreżentante di l'adulti). Questi pannelli online sò mètudi non pruspettivi, perchè micca chì tutti ùn anu una probabilita sapissera, nonzero d'inclusión. Ancu s'ellu ùn sò micca probabilitati pannelli online sò digià utilizatu da i cuncettorii suciali (per esempiu, a CCES), ci hè ancu un pocu dibattimentu nantu à a qualità d'estimazioni chì vènenu da elli (Callegaro et al. 2014) .

Malgradu questi debbuli, pensu chì ci sò dui raggiuni per chì u tempu hè ghjustu per i pruduttori suciale per riimpiemu un sampling non-probabilisticu. Prima, in l'era digitale, anu parechji sviluppi in a cullizzioni è l'analisi di e specie di non probabilitati. Esse metudi novi hè diversificatu solu da i metudi chì pruvucaru prublemi in u passatu chì pensu chì hè sensu pinsà d'elli cum'è "non-probabilità lagine 2.0". A seconda causa perchè i ricchieri annunziate di ricunquà micca di probabilità chì u prucedimentu hè solu per a probabilità di mostra in i pratichi sò diventiti difficili. Quandu ci sò altisimuli di non-risposta, perchè ci sò in esame realmenti, e probabilità di l'inclusi per i rispondenti sò micca cunnisciuti, è cusì, e lagoni di probabilitati è esempii di non probabilitati ùn sò micca quant'è parechji altri circarini chì credi.

Comu dissi prima, i lagoni di non prubabilità sò visturati cù un gran escepticismu da parechji miràziuri suciali, in parte perchè u so rolu in certi u più vangardenti falluti in i primi tempi di a ricerca di storia. Un esempiu chjude di quantu avemu avutu cù samma di non probabilità hè a ricerca di Wei Wang, David Rothschild, Sharad Goel, è Andrew Gelman (2015) chì esse ricuperamente recoveratu u risultatu di l'elezzione in u 2012 cù un sample di non probabilitati Utuleus Xbox americane: una dimostrazione senza mutilanti di l'Americhi. I riciclati ricuaccendu à i rispondenti da u sistema di ghjocu XBox, è cumu pudete esse espertu, a disputenza Xbox sviutata maschile è sughjetti di ghjovani: 18- à 29 anni anu 19% di l'elettore, ma u 65% di a Xbox è l'omi cumpone 47% di l'elettore, ma u 93% di u dispunellu Xbox (figura 3.7). Per via di sti pritesi demografichi forti, a data di a Xbox rivoluta era un poviru indikatore di ritornu elettorali. Hè preditu una vittoria forti per Mitt Romney nantu à Barack Obama. Doppu, questu hè un altru esempiu di i periculi di e laghi senza probabilitati senza esità, è ricunnisciute di u fiasco Scalu littestale.

Figura 3.7: Demografia di i rispondenti in W. Wang et al. (2015). Perchè i rispondenu anu recluitu da XBox, eranu più prubabili di esse ghjovani è più prubabile di esse u male, relative à i votanti in l'elizzioni in u 2012. Adattazione di W. Wang et al. (2015), figura 1.

Figura 3.7: Demografia di i rispondenti in W. Wang et al. (2015) . Perchè i rispondenu anu recluitu da XBox, eranu più prubabili di esse ghjovani è più prubabile di esse u male, relative à i votanti in l'elizzioni in u 2012. Adattazione di W. Wang et al. (2015) , figura 1.

In ogni casu, Wang è i culleghi sò stati cunzignati di sti prublemi è pruvatu à aghjurnà per u prucessu di mostra di non aleatorii à l'estimazioni. In particulare, utilizonu a postratazzioni , una tecnica chì hè ancu usata assai per aghjurnà a specimensu di probabilitati chì anu avutu i errore è a non-risposti.

L'idea principale di postratificazione hè di utilizà infurmazione à l'usu di a destinazione di destinazione per aiutà à migliurà l'estimazione chì vene da una mostra. Quandu l'usu di a postratazzioni di fà stimi da u so probabbilità micca di probabilitati, Wang è u collegu hà tagliatu a pupulazione in parechji gruppi, stimi l'supportu per l'Obama in ogni gruppu, è poi pigliò una medità ponderada di l'estimazioni di u gruppu per pruduce una estimazione generale. Per esempiu, pudessenu split a populazione in dui gruppi (omi è donne), hà stimatu u supportu per Obama entre l'omi è a donne, è esse stimatu l'assistenza generale per l'Obama per piglià un mediu ponderatu per esse dinò chì i donne facenu 53% di l'elettore è l'omi 47%. Cùbbe, post-stratificazione aiuta à corrette per una mostra disinibbili attraendu in l'infurmazioni aiutu à e grandezza di i gruppi.

A chjave per a stratificazione hè di fà i gruppi ghjustici. Se pò scopre a pupulazione in gruppi homogeni cumu chì a propensità di rispunsenu sò uguali per ognunu in ogni gruppu, a seguita di a stratificazione produci un pruduttu imparziali. In altre parolle, post-stratificazione per genere produci un estimatu imparziali si tutti l'omi anu a risposta di propensità è tutte e donne anu the same propensità di rispunsabilità. Questa suposizione hè chjamata a supposizioni homogenee-risposta-propensità-dentro di e gruppi , è a dispunìbu più in i noti matematii à a fini di stu capitulu.

Di sicuru, pare micca improbabile chì e propensità di risposta seranu a stessa per tutti l'omi è tutte e donne. In ogni modu, l'assicuranza homogeneia-risposta-propensità-in-gruppi hè diventita più plausible cum'è u numuru di gruppi sviluppa. À questu, hè più faciule per aghjà à a pupulazione in gruppi oghjani cun uccidintali si create più gruppi. Per esempiu, pò esse inesparace chì tutti e donne anu the same propensità di rispùnziu, ma puderia pare micca più plausibile chì ci hè a propria risposta per tutti e donne chì anu 18-29 anni, chì si sò graduate di l'università è chì sò in Californie . Cusì, cum'è chì u numaru di gruppi usati in a postratratazione hè più grande, l'ipotevule necessariu per sustene u metudu diventenu più prudenti. In vista di questu fattu, i circherosu spessu vulete crià un gran numaru di gruppi per a postratazzioni. In ogni modu, cum'è u numbru di gruppi agghiuncinu, i ricercati corse in un problema diffirenti: sparsity di dati. Se ci sò solu un pocu nimu di pirsuni in ogni gruppu, l'estimazioni seranu più inchiziosi, è in u casu estremu chì un gruppu ùn hà nunda chì pò esce da l'esame, a stratificazione dopu stalla sviluppa.

Ci sò dui modi da quella tensione intrutiva trà a plausibilità di l'assicuranza homogenee-risposta-propensità in i gruppi è a dumanda di dimustrazioni rabe raziali in ogni gruppu. Prima, i circhuli pudemu cumprà un mudellu più grande, più diversu, chì aiuta à assicurà un tamantu razzei di mostra in ogni gruppu. Secondu, ponu utilizà un mudellu statisticu più sofistatu per fà estimi in gruppi. E, in fattu, certe volte i ricercati facenu dui, cum'è Wang è i culleghi facianu cun u studiu di l'elizzioni à i rispondenti da Xbox.

Perchè anu utilizatu un metudu chjappu di probabilità cù l'entrevista cumminciata per l'informatiche (parlaraghju più di l'entrevista amministrativi di l'amministrazione in l'articulu 3.5), Wang è i culleghi anu ricupratura di ricerca di u prezzu, chì ci permete di recullari la informazioni di 345.858 unicu participanti , un numaru enormu da i normi di u votu di l'election. Stu grandezza massima di dispusizione facenu a formate un gran numaru di gruppi postratralizificate. Invece chì a postratazzioni tipica tipica di taglià a populazione in centenari di gruppi, Wang è collegues dividi u populazione in 176.256 gruppi definite per genere (2 categorii), razza (4 categorii), età (4 categorii), educazione (4 categorii), state (51 categorii), parti ID (3 categorii), ideolugia (3 categorii), è votu di u 2008 (3 categorii). In altri palori, u so grandu mudellu di mostra, chì fù attivatu da a recullata di datu low cost, hà permessu di fà una supposizioni più plausible in u so prucessu di stima.

Ancu ma 345.858 unicu participanti, però, ci era ancu assai, numerosi gruppi per u quali Wang è i culleghi ùn anu avutu casi nisunu rispondenu. Per quessa, anu utilizatu una tecnica chjamata regresione multilevelu per stimarna u sustegnu in ogni gruppu. Essenzialmente, per stimarna u supportu per l'Obama in un gruppu specificatu, a regressione multileveli aghjunghjenu infurmazioni da parechji gruppi cullugati. Per esempiu, imagine chì pruvate per estimà u supportu per Obama trà e femine in l'Hispanica trà 18 è 29 anni, chì sò studienti universitari, chì sò dumandati i Democratii, chì si identificanu com moderate, è chì vutaru à Obama in 2008. Questa hè una , gruppu assai specificu, è hè pussibule chì ùn ci hè nimu in l'esemplariu cun sti caratteristiche. Perchè, per fà estimi annantu à questu gruppu, regressione multilevel usa un mudellu statìsticu à aghjustà e estimazioni di i persone in gruppi assai simili.

Cusì, Wang è i culleghi anu utilizatu un accorsu chì aghjunghjenu a regressione multitelevelle è a postratizazione, cusì chjamà a so strateġija di regresione multileveli cù a postratazzioni o, cun più afficezza, "Mr. P. "Quandu Wang è i culleghi utilizà u Signore P. per fà estimazioni di u sample di non-probabilitati XBox, producinu estimi assai vicinu à u sustegnu generale chì Obama hà ricevutu in l'election 2012 (figura 3.8). In fattu i so estimi eranu più preciziosi chì un aghjume di i vogliu tradiziunale d'opinioni pùblicu. Cusì, in stu casu, l'aghjurnamentu statistici -crivicamenti u pezzu di P.-parianu di fà un bon travagliu corrigie i preghjeti in non-probabilità di dati; preghjudizii chì eranu chjaramente visibili quannu vi vede l'estimi da a Xbox nbspjusted data.

Figura 3.8: Estimi da W. Wang et al. (2015). Unsautu di XBox hà pruduttu estimi inaccurati. Ma, a mostra di XBox ponderatu pruduciutu chì eranu più precisa chì un mediu d'insegnasi telefunale in probabilità. Adattazione di W. Wang et al. (2015), i figuri 2 è 3.

Figura 3.8: Estimi da W. Wang et al. (2015) . Unsautu di XBox hà pruduttu estimi inaccurati. Ma, a mostra di XBox ponderatu pruduciutu chì eranu più precisa chì un mediu d'insegnasi telefunale in probabilità. Adattazione di W. Wang et al. (2015) , i figuri 2 è 3.

Ci sò dui corsi di u studiu di Wang è i culleghi. Prima, i lagle di non probabilità da unambiguazione pò pruponi l'estimi male; Questa hè una lezione chì parechji furmuli anu intesu prima. A seconda lecite, però, hè chì e mostru di non probabilitati, quandu analizate bè, pò esse pruduceramente boni stimi; e chjaru di non probabilità ùn devenu micca guidendu automaticamente a quarchi cosa cum'è u fiasco Scorsese Literatu .

Avanzendu, se sè u tentativu di decisione entre l'utilizazione d'un accorche di probabilità è di un accostu di mostrage non-probabiliè avè una scopeta difficult. Certe volte i ricerchiate volenu una regula rapida è rigida (per esempiu, utilizate sempre probabilità mètudi di mostra), ma hè sempri più difficiuli di prupone una regula. I ricchieri face una difficultà scelta trà i probabilitati metudii in i prublemi, chì sò sempri cchiù cari e distanti da i risultati teorichi chì justificà i so mette di i pruduzzioni di u usu è di prublema, chì sò più prezzu è più veloce, ma di più menu familiari è più variati. Una cosa chì hè chjara, però, hè chì si avete bisognu di travaglià cun esempii di probabilitati o d'altri fonti di fonti nonrepresentative (pensate à u Chapter 2), ci hè un mutivu risicu per crede chì stimi fatti cù a postratatazioni è tecniche cunnessi seranu megliu ch'è micca fissi, stimi primas.