3.4.2 analise Non-prubabilità: chila

Stu traduzione statu creatu da un urdinatore. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 analise Non-prubabilità: chila

Cù analise non-prubabilità, pesi po mori distortions incausatu da u prucessu sediment capitu.

In u stessu modu chì circadori pisu risposti da analise prubabilità, ch'elli si ponu dinù a pisu risposti da analise non-prubabilità. Per esempiu, cum'è una alternativa à u CPS, pensà chì ti serbit annunci bandera nantu à millaie di siti, di ricrutari na participanti di ntôn rilivamentu à cuntà a ragione disoccupazioni. Certu, tu fussi scetticu chì u simplici tempu di i vostri campionu saria una bona stimata di l 'acqua di disoccupazioni. Your lu scetticismu hè u sìmbulu, perchè tų pensu chì certi pirsuni sunnu più atta à compie a vostra log chè l 'altri. Per esempiu, genti chi nun li pozzu spenniri assai di u tempu nantu à u web sò menu atta à compie a vostra log.

Comu avemu vistu in l 'ultimi rùbbrica, parò, s'è no sacciu comu u campionu fu scigghiutu-Campemu cù prubabilità analise-allura putemu mori distortions incausatu da u prucessu sediment. Per disgrazia, quandu a travagghiari cu analise non-prubabilità, no, nun sacciu comu fu scigghiutu di u campionu. Ma, putemu fari iputesi supra lu prucessu sediment e poi dumandà chila a lu stissu modu. S'è sti stori sò currettu, allura lu chila ci mori lu distortions incausatu da u prucessu sediment.

Per esempiu, pensà chì a risposta à u vostru Annunci di Beni culturali, vi ricrutati 100.000 respondents. Però, tu, nun cridennu ca sutta sti 100.000 respondents sò trovi na semprici incerta di francese generale americanu. In fatti, quand'è tù parauni di u vostru respondents à la pupulazzioni US, appena ti susi ddu populu da parechji stati (per esempiu, New York) sò più di-rapprisintatu è chì la ghjenti da parechji stati (per esempiu, Alaska) sò sutta-rapprisintatu. Cusì, u tassu disoccupazioni di u vostru campionu hè atta à esse un gattivu stimata di l 'acqua di disoccupazioni in la pupulazzioni testu.

Una manera à mori lu luddie chì hè accadutu in u prucessu sediment hè di stabilisce pesi à ogni persona; pesi bassu à a ghjente da pace chì sò più di-rapprisintatu in u campionu (per esempiu, New York) e pesi supiriuri a ghjente da pace chì sò sutta-rapprisintatu in u campionu (per esempiu, Alaska). Più pricisamenti, lu pisu di ogni respondent ca è sumigghianti a so murfulugia in u vostru campionu parente à a so murfulugia in la pupulazzioni US. Sta prucedura chila veni chiamatu post-stratificazzioni, e l 'idia di pisa deve rammintà, à voi di l' asempiu in Section 3.4.1 unni respondents da Rhode Island erani dati di menu pesu chè respondents da a California. Post-stratificazzioni esige chì sai basta à mette u vostru respondents in i gruppi è à cunnosce i idea di la pupulazzioni di testu in ogni gruppu.

Puru siddu li chila di u campionu prubabilità è di u campionu non-prubabilità sunnu li stissi mathematically (voir penale tecnicu), si u travagliu bè à a situazioni. Sè u militante hè un campionu prubabilità perfetta (zoè, nuddu un'errore animali à e non-risposta), tandu chila appruduciunu estimates Museu di tutti i tratti in tutti i casi. Stu forti, chì guarantisci teorichi è per quessa addumanna di analise prubabilità s'arriviglia cu li accussì attrattiva. Nantu à u cuntrariu, analise non-prubabilità chila sarà solu elaburazione di estimates Museu di tutti i tratti s'è u propensities sècutu sunnu li stissi di chiddi in ogni gruppu. Nta àutri paroli, cridìannu ritornu à u nostru esempiu, aduprendu post-stratificazzioni appruduciunu estimates Macelleria s'è ognunu in a New York hà u listessu prubabilità di participà, è ognunu in Alaska havi lu stissu prubabilità di participà, è cetara è cetara. Stu assuntu ca veni chiamatu lu homogeneous-risposta-propensities-moins de-i gruppi assuntu, e si ghjoca un rolu mpurtanti in sapennu siddu post-stratificazzioni avanti, travagliu bè cù analise non-prubabilità.

Purtroppu, in u nostru esempiu, i pensà homogeneous-risposta-propensities-moins de-i gruppi pari ca nun prubbàbbili a essiri veru. Chì hè, quantu pari nun prubbàbbili ca tutti in Alaska havi lu stissu prubabilità di essa in i vostri log. Ma, ùn ci sò trè punti impurtanti à tene in mente su post-stratificazzioni, tutti di cui fà lu in parenu di più spiranza.

Prima, homogeneous-risposta-propensities-moins de-i gruppi pensà diventa di più ca comu lu nùmmaru di gruppi aumenta. È, circadori ùn sò limitati à i gruppi cum'è basa annantu à una sola dimensione giugrafica. Per esempiu, si pudia creà gruppi si basa supra Statu, l'età, sex, è a liveddu di l 'aducazzioni. Mi pari di più occasioni chì ùn ci hè propensities risposta homogeneous nella u gruppu di 18-29, i diploma di Femmina, Giovanni Pierluigi vivono in Alaska cà dintra lu gruppu di tutti i parsoni in Alaska. Cusì, cum'è u numeru di i gruppi usatu di aumenta post-stratificazzioni, u iputesi abbisugnava pi sustèniri lu divintari cchiù raggiunevuli. Datu stu fattu, mi pari comu un circadori vulissi pi criari nu nummiru salti di i gruppi di post-stratificazzioni. Ma, comu lu nùmmaru di gruppi ingrossa, circadori iù na diffirenti prublema: sparsity dati. Si ci sunnu sulu un ristrettu nummaru di pirsuni in ogni gruppu, allura lu estimates sarà più ncertu, è in lu casu stremu, unni ci hè un gruppu chì ùn hà mancu respondents, tandu post-stratificazzioni cumplitamenti U ghjucadore. Ci sunnu dui modi fori di stu tinzioni di stu mondu trà i plausibility di homogeneous- pensà risposta-tendenza-moins de-i gruppi e li dumanda di grannizza campionu raggiunevuli in ogni gruppu. Un avvicinamentu è si movi versu un mudellu di statìstiche cchiù sufisticata per calculer pesi e l 'autri è à fà sorte una, campionu di più a diversità di salvaticu chì aiuta guarantiscenu a smania di campionu raggiunevuli in ogni gruppu. È, qualchì volta circadori fari tutti dui, comu I Mulateri Di L'discrive a più tecnica quì sottu.

A seconda parte o quandu a travagghiari cu post-stratificazzioni da analise non-prubabilità è chì u pensà homogeneous-risposta-tendenza-moins de-i gruppi hè digià friquintimenti fatta quannu ppi analise prubabilità. U mutivu ca sta pensà hè bisognu di analise prubabilità in pratica hè chì analise prubabilità hannu non-risposta, e lu mètudu cchiù cumuni di Cuscinetti di non-risposta hè post-stratificazzioni comu discrittu sopra. Di sicuru, sulu picchì tanti circadori fari 'na certa' assuntu ca nun significa ca tu avissi a fari lu troppu. Ma, ùn ci hè significheghju micca che quandu comparing analise non-prubabilità à analise prubabilità in pratica, ci vole à tene à mente chì à tempu addipenni iputesi è nantu à u verbu ausiliari pi prudùciri estimates. In u bastimentu più realistu, ùn ci hè da renda senza avvicinamentu senza-pensà à inference.

Infine, s'è vo tini unu stimata in particulare-à u nostru esempiu disoccupazioni ragione-tandu vi tuccherà à cundizione furmazzioni cchiù homogeneous-risposta-tendenza-nella-gruppi di pensà. Spicificamenti, tu nun serbi pi manu di pigghiarivi li chi ognunu havi lu stissu tendenza risposta, tu sulu tuccherà à incaricà si ch'ellu ùn ci hè nimu correlation trà tendenza risposta è ragione disoccupazioni moins de ogni gruppu. Di sicuru, ancu sta cundizione scintìfica ùn chjappà in certi situazzioni. Per esempiu, à pensà estimating u Data di Italu miricani ca fà u travagliu è vuluntarii spartuti. S'è pòpulu chì fà travagliu è vuluntarii spartuti à sò più atta à usu pi essiri in ntôn rilivamentu, tandu circadori vi chjamate più di-cuntà u numeru di volunteering, spissu anchi si si fà adjustments post-stratificazzioni, un fruttu chì hè statu dimustratu empirically par Abraham, Helms, and Presser (2009) .

Comu aghju dettu nanzu, analise non-prubabilità sò viste e cu granni lu scetticismu par scinziati suciali, in parte per via di a so funzione à certi di i fiaschi più embarrassing in u principiu di ghjorni di ricerca log. A chiaru asempiu di comu luntanu no simu ghjunti cun analise non-prubabilità è i ricerchi di Wei Wang, David Lucia, Sharad Goel, è Andrew Gelman chì vulia ripigghiau lu risultatu di l 'elezzione di u 2012 US usannu un santu non-prubabilità di patti americana Xbox -a campionu da veru non-incerta di Miricani (Wang et al. 2015) . Li arricercatura ricrutati respondents da u sistema Lusinghi Xbox, e comu tu putissi s'aspittava, u campionu Xbox skewed masculi e skewed giovani: 18 - 29 annu Olds make up 19% di i Maschera ma 65% di u campionu Xbox è l 'omi creanu 47% di u Maschera è 93% di u campionu Xbox (Figura 3.4). A causa di sti forti biases demugrafica, quannu li dati crudu Xbox era un poviru pupu, volume di rende elezzione. Si putìa prividiri un forti vittoria di Mitt Romney nantu à Barack Obama. Di novu, issu hè un altru esempiu di i rinunziò di, analise non-prubabilità unadjusted crudu e si ricorda di u scars Lingua Digest.

Figura 3.4: Pupulazzioni respondents in Wang et al. (2015) . Pirchì respondents eranu ricrutati da Xbox, ch'elli eranu più atta à esse ghjovanu è più atta à esse maschili, parente à elettori à l 'elezzione di u 2012.

Tuttavia, Wang e culleghi eranu cuscenti di sti prublemi, e cuntinuava pruvari a pisu lu respondents à rimpruverà di u prucessu sediment. In particulari, usàvanu na forma cchiù sufisticatu e di la scola post-stratificazzioni ti dissi circa. Ci vò à què un pocu di più nantu à u so accostu postu ch'è costruisce intuizione su post-stratificazzioni, è u particulare versione Wang e culleghi usatu hè unu di i avvicinamenti più passiunanti à analise non-prubabilità chila.

In u nostru esempiu sèmplice su estimating disoccupazioni in Section 3.4.1, avemu spartutu dâ pupulazzioni nta gruppi si basa supra lu statu di residenza. In cuntrastu, Wang e culleghi divisi a pupulazioni ni ni 176.256 gruppi definita da: sissuali (2 categorie), a punti (4 categorie), l 'età (4 categorie), istruzzioni (4 categorie), u statu (51 catigurìi), ID partitu (3 categorie), tèrmini (3 categorie) è di u 2008 votu (3 categorie). Incù più i gruppi, i circadori la spiranza ca fussi sempri chiù prubabili ca moins de ogni gruppu, risposta tendenza era uncorrelated cù un sustegnu per Obama. Next, chiu tostu di custruisce di pesi-livellu individuale, comu avemu fattu in u nostru esempiu, Wang e culleghi usatu un mudellu cumplessu à cuntà i Data di parsoni in ogni gruppu ca si pìgghianu di Obama. Infine, si misu a sti estimates gruppu di sustegnu cu la grannizza canusciutu di ogni gruppu à pruducia un livellu siant piscadori di sustegnu. Nta àutri paroli, si petrusellu, su la pupulazzioni nta diversi gruppi, stimati à u sustegnu di Obama in ogni gruppu, è tandu pigliò un mediu value di u estimates gruppu di pruducia stimata da u megliu.

Cusì, i grandi sfida a so avvicinamentu è à cuntà à u sustegnu di Obama in ognunu di sti 176.256 gruppi. Puru siddu li panel, inclusu 345.858 participanti unicu, un nùmeru offre da u mudellu di unfranchised elezzioni, ùn ci eranu tanti, tanti gruppi di cui Wang e culleghi quasgi più respondents. Ghjè per quessa, à cuntà à u sustegnu in ogni gruppu usàvanu na tecnica chjamata rughju multilevel cu post-stratificazzioni, chì circadori affettuosu chjamate Mr. P. pè u più, à cuntà à u sustegnu di Obama nella un gruppu spicìficu, lu signor P. Piscines nantu à u corsu da parechji attentamenti gruppi riguardanti. Per esempiu, cunziddirati li sfida di estimating u sustegnu di Obama à mezu à Hispanics Femmina,, tra 18-29 anni, chì sò i diploma di u liceu, chì sò arregistrati in Dimucràtici, chì self-identificà comu moderates, è chì hà vutatu per Obama in u 2008. Chistu hè un gruppu assai, e spicìfici assai, è si pò accade chì ùn ci hè nimu à u campionu cu sti caratteri. Ghjè per quessa, a fari estimates circa di stu gruppu, signor P. Piscines inseme estimates da populu in i gruppi assai simile.

Aduprendu stu strategia analisi, Wang e culleghi puderunu turrà à aduprà u campionu non-prubabilità Xbox à cuntà assai più strettu à u sustegnu u megliu chi Obama ricevutu in u elezzione di u 2012 (Figura 3.5). In fatti i so estimates eranu più precisa chè un aggregate di polls upinione publica. Dunque, in stu casu, chila-spicificamenti Mr. P.-pari ca a fari 'na bona impiegu currèggiri lu biases in dati non-prubabilità; biases ca sunnu visìbbili quannu ti guardu u estimates da i dati Xbox unadjusted.

Figura 3.5: Estimates da Wang et al. (2015) . campionu Xbox Unadjusted pruduciutu estimates inaccurate. Ma, u campionu Xbox value pruduciutu estimates chi eranu più precisa chè un mediu di salumi, liberta prubabilità-based.

Ci sunnu dui lizioni principale da u studiu di Wang e culleghi. Prima, analise non-prubabilità unadjusted pò purtà à estimates mala; chistu è 'na lezzioni ca tanti circadori ani intesu nanzu. Tuttavia, la seconda lezziò è chì analise non-prubabilità, quandu linguistic dunca, putemu primurosu di fà u calmu bona estimates. In fatti, a so estimates eranu più precisa chè u estimates da pollster.com, un FataTurchina di più tradiziunale polls elezzione.

Infine, ùn ci sò impurtante inevitevuli à ciò chì si pò amparà da stu unu studiu specifichi. Eccu pirchì post-stratificazzioni travagliatu bè in stu casu particulare, ùn ci hè nimu chì guarantisci ca lu in avanti, travagliu ancu in altri casi. In fatti, alizzioni sunnu forsi unu di l'ozzione più faciule per via pollsters hannu statu u valore alizzioni di quasi 100 anni, ùn ci hè pack rigulari (putemu vidiri ca vinci l 'elizzioni), è identificazione à u partitu di e caratteristiche demugrafica sò abbastanza predictive di vutari. A 'stu puntu, avemu mancatu tiurìa ferma, è spirienza, segna a sapiri quannu chila adjustments à analise non-prubabilità appruduciunu estimates micca abbastanza pricisa. Una cosa chì hè chjaru, parò, è s'è vo vulete furzatu a travagghiari cu analise non-prubabilità, tandu ùn ci hè forti raghjoni à crede chì estimates pulito sarà megliu cà estimates non-pulito.