3.4.2 ki pa Peye-pwobabilite echantiyon: pondération

Avèk echantiyon ki pa pwobabilite, pwa ka defèt deformasyon ki te koze pa pwosesis la pran echantiyon sipoze.

Menm jan an tou ke chèchè pwa responses from echantiyon pwobabilite, yo kapab tou pwa responses from echantiyon ki pa pwobabilite. Pou egzanp, kòm yon altènativ a CPS yo, imajine ke ou mete Ajoute banner sou dè milye de sit yo rekrite patisipan yo pou yon sondaj yo estime to chomaj la. Natirèlman, ou ta dwe doute ke vle di la senp nan echantiyon ou ta dwe yon estimasyon bon nan to chomaj la. dout ou se pwobableman paske ou panse ke gen kèk moun ki gen plis chans yo fini sondaj ou pase lòt moun. Pou egzanp, moun ki pa pase yon anpil tan sou entènèt la yo gen mwens chans reponn kesyonè sondaj ou yo.

Jan nou te wè nan seksyon ki sot pase a, sepandan, si nou konnen ki jan echantiyon an te chwazi-jan nou fè ak pwobabilite echantiyon-lè sa a nou ka defèt deformasyon ki te koze pa pwosesis la pran echantiyon. Malerezman, lè w ap travay ak echantiyon ki pa pwobabilite, nou pa konnen ki jan echantiyon an te chwazi. Men, nou ka fè sipozisyon sou pwosesis la pran echantiyon ak Lè sa a aplike pondération nan menm fason an. Si sa yo sipozisyon yo kòrèk, Lè sa a, pondération la ap defèt deformasyon yo ki te koze pa pwosesis la pran echantiyon.

Pou egzanp, imajine ke an repons a Ajoute banner ou, ou rekrite 100,000 moun ki repond. Sepandan, ou pa kwè ke sa yo 100,000 moun ki repond yo yon echantiyon senp o aza nan granmoun Ameriken an. An reyalite, lè ou konpare moun ki repond ou nan popilasyon an US, ou jwenn ke moun ki sòti nan kèk eta (egzanp, New York) gen plis pase-reprezante e ke moun ki sòti nan kèk eta (egzanp, Alaska) yo anba-reprezante. Se konsa, to chomaj la nan echantiyon ou se chans yo dwe yon estimasyon move nan to chomaj la nan popilasyon an sib.

Youn nan fason yo defèt deformation nan sa ki te rive nan pwosesis la pran echantiyon se yo asiyen pwa nan chak moun; pi ba pwa nan moun soti nan eta ke yo sou-reprezante nan echantiyon an (egzanp, New York) ak pi wo pwa nan moun soti nan eta ke yo anba-reprezante nan echantiyon an (egzanp, Alaska). Plis espesyalman, se pwa a pou chak moun ki konsène ki gen rapò ak prévalence yo nan echantiyon relatif ou a prévalence yo nan popilasyon an US. Sa a se pwosedi pondération rele pòs-stratifikasyon, ak lide a nan peze ta dwe fè ou sonje nan egzanp lan ki nan Seksyon 3.4.1 kote moun ki repond soti nan Rhode Island te ba yo mwens pwa pase moun ki repond soti nan California. Post-stratifikasyon mande pou ke ou konnen ase yo mete moun ki repond ou an gwoup epi konnen pwopòsyon de popilasyon an sib nan chak gwoup.

Malgre ke pondération la nan echantiyon an pwobabilite ak nan echantiyon an ki pa pwobabilite yo matematik nan menm (gade teknik apendis), yo travay byen nan sitiyasyon diferan yo. Si chèchè a gen yon echantiyon pwobabilite pafè (sa vle di, pa gen okenn erè pwoteksyon e pa gen ki pa repons-), Lè sa a, pondération yo pral pwodwi estimasyon san patipri pou tout karakteristik nan tout ka. Sa a garanti fò teyorik pou rezon sa moun kap defann nan echantiyon pwobabilite jwenn yo se konsa atire. Nan lòt men an, pondération echantiyon ki pa pwobabilite pral sèlman pwodwi estimasyon san patipri pou tout karakteristik si disposisyon yo repons se menm bagay la pou tout moun nan chak gwoup. Nan lòt mo, panse tounen nan egzanp nou an, lè l sèvi avèk pòs-stratifikasyon yo pral pwodwi estimasyon san patipri si tout moun nan New York gen pwobabilite a menm nan k ap patisipe ak tout moun nan Alaska gen pwobabilite a menm nan k ap patisipe ak sou sa. Se sipozisyon sa a rele omojèn-repons-disposisyon-nan-gwoup sipozisyon an, epi li jwe yon wòl kle nan konnen si pòs-stratifikasyon pral travay byen ak echantiyon ki pa pwobabilite.

Malerezman, nan egzanp nou an, sipozisyon an omojèn-repons-disposisyon-nan-gwoup sanble fasil yo dwe vre. Ki se, se li sanble fasil ke tout moun nan Alaska gen pwobabilite a menm pou yo te nan sondaj ou yo. Men, gen twa pwen enpòtan kenbe nan tèt ou sou pòs-stratifikasyon, nan tout ki fè li sanble plis pwomèt.

Premyèman, omojèn-repons-disposisyon-nan-gwoup sipozisyon vin pi posib ke nimewo a nan gwoup ogmante. Epi, chèchè yo pa limite a gwoup jis ki baze sou yon sèl dimansyon jeyografik. Pou egzanp, nou te ka kreye gwoup ki baze sou eta a, laj, sèks, ak nivo nan edikasyon. Li sanble plis posib ki di ke gen disposisyon repons omojèn nan gwoup la nan 18-29, gradye fi, kolèj k ap viv nan Alaska pase nan gwoup la nan tout moun k ap viv nan Alaska. Se konsa, kòm nimewo a nan gwoup itilize pou ogmante pòs-stratifikasyon, sipozisyon yo ki bezwen sipòte li vin pi rezonab. Bay sa a reyalite, li sanble tankou yon chèchè ta vle kreye yon nimewo gwo nan gwoup pou pòs-stratifikasyon. Men, kòm nimewo a nan gwoup ogmante, chèchè kouri antre nan yon diferan pwoblèm: sparsity done. Si gen yo, se sèlman yon ti kantite moun nan chak gwoup, lè sa a estimasyon yo ap gen plis ensèten, ak nan ka a ekstrèm kote ki gen yon gwoup ki pa gen okenn moun ki repond, lè sa a pòs-stratifikasyon konplètman kase desann. Gen de fason pou soti nan tansyon sa a nannan ant vrèsanblans la nan homogeneous- repons-potansyèl-nan-gwoup sipozisyon ak demann lan pou gwosè echantiyon rezonab nan chak gwoup. Youn apwòch se pou yo avanse pou yon modèl pi plis sofistike estatistik pou kalkile pwa ak lòt la se kolekte yon pi gwo, plis divès echantiyon, ki ede asire gwosè echantiyon rezonab nan chak gwoup. Epi, pafwa chèchè fè tou de, jan mwen pral dekri nan plis detay pi ba a.

Yon konsiderasyon dezyèm lè w ap travay ak pòs-stratifikasyon soti nan echantiyon ki pa pwobabilite se ke sipozisyon an omojèn-repons-potansyèl-nan-gwoup se deja souvan te fè lè analize echantiyon pwobabilite. Rezon ki fè se sipozisyon sa a ki nesesè pou echantiyon pwobabilite nan pratik se ke echantiyon pwobabilite gen ki pa repons, ak metòd ki pi komen pou ajiste pou moun ki pa repons-a se pòs-stratifikasyon jan sa dekri pi wo a. Natirèlman, jis paske anpil chèchè fè yon sipozisyon sèten pa vle di ke ou ta dwe fè li tou. Men, li vle di ke lè yo konpare echantiyon ki pa pwobabilite echantiyon pwobabilite nan pratik, nou dwe kenbe nan tèt ou ke tou de depann sou sipozisyon ak enfòmasyon oksilyè yo nan lòd yo pwodwi estimasyon. Nan anviwònman pi reyalis, gen tou senpleman pa gen okenn apwòch sipozisyon-lib yo enferans.

Finalman, si ou pran swen sou yon estimasyon an patikilye-nan egzanp chomaj nou an to-Lè sa a, ou bezwen yon kondisyon pi fèb pase omojèn-repons-potansyèl-nan-gwoup sipozisyon. Espesyalman, ou pa bezwen asime ke tout moun gen menm potansyèl la repons, ou sèlman bezwen asime ke pa gen okenn korelasyon ant potansyèl repons ak to chomaj nan chak gwoup. Natirèlman, menm kondisyon sa a pi fèb pa pral kenbe nan kèk sitiyasyon. Pou egzanp, imajine estime pwopòsyon de Ameriken ki fè travay kòm volontè. Si moun ki fè travay volontè yo gen plis chans dakò yo dwe nan yon sondaj, lè sa a chèchè pral sistematik sou-estime kantite lajan an nan ofri sèvis kòm volontè, menm si yo fè ajisteman pòs-stratifikasyon, yon rezilta ki te demontre pwouve pa Abraham, Helms, and Presser (2009) .

Kòm mwen te di pi bonè, echantiyon ki pa pwobabilite yo wè ak gwo dout pa syantis sosyal, nan pati paske yo te wòl yo nan kèk nan echèk yo ki pi anbarasan nan jou yo byen bonè nan rechèch sondaj la. Yon egzanp klè nan ki jan lwen nou te vin ak echantiyon ki pa pwobabilite se rechèch la nan Wei Wang, David Rothschild, Sharad Goel a, ak Andre Gelman ki kòrèkteman refè rezilta a nan 2012 eleksyon an US lè l sèvi avèk yon echantiyon ki pa pwobabilite nan Endyen Xbox itilizatè -yon echantiyon Désidéman ki pa o aza nan Ameriken (Wang et al. 2015) . Chèchè yo te rekrite moun ki repond nan sistèm nan bank ksboks, ak jan ou ta ka atann, echantiyon an Xbox fose gason ak fose jenn: 18 - timoun ki gen 29 ane fè moute 19% nan elektora a, men 65% nan echantiyon an Xbox ak moun fè moute 47% nan elektora a ak 93% nan echantiyon an Xbox (figi 3.4). Paske nan sa yo prejije fò demografik, anvan tout koreksyon Xbox done a te yon endikatè pòv nan retounen eleksyon an. Li prevwa yon viktwa pi fò pase Mitt Romney sou Barack Obama. Yon fwa ankò, sa a se yon lòt egzanp nan danje ki genyen nan anvan tout koreksyon, echantiyon ki pa pwobabilite brut ak se okoumansman de fyasko nan Literary Digest.

Figi 3.4: Enfòmasyon detaye nan moun ki repond nan Wang et al. (2015). Paske repond yo te rekrite soti nan ksboks, yo te plis chans yo dwe jèn ak plis chans yo dwe gason, relatif nan votè yo nan eleksyon an 2012.

Figi 3.4: Enfòmasyon detaye nan moun ki repond nan Wang et al. (2015) . Paske repond yo te rekrite soti nan ksboks, yo te plis chans yo dwe jèn ak plis chans yo dwe gason, relatif nan votè yo nan eleksyon an 2012.

Sepandan, Wang ak kòlèg te okouran de pwoblèm sa yo ak eseye pwa moun ki repond yo yo korije pou pwosesis la pran echantiyon. An patikilye, yo te konn itilize yon fòm pi plis sofistike nan pòs-stratifikasyon la mwen te di nou sou yo. Li se vo aprann yon ti jan plis sou apwòch yo paske li bati entwisyon sou pòs-stratifikasyon, ak vèsyon an patikilye Wang ak kòlèg itilize se youn nan apwòch yo pi enteresan yo pondération echantiyon ki pa pwobabilite.

Nan egzanp ki senp nou an sou estime chomaj nan Seksyon 3.4.1, nou divize popilasyon an an gwoup ki baze sou eta de rezidans. Nan contrast, Wang ak kòlèg divize popilasyon an nan nan 176.256 gwoup defini nan: sèks (2 kategori), ras (4 kategori), laj (4 kategori), edikasyon (4 kategori), eta a (51 kategori), ID pati (3 kategori), ideoloji (3 kategori) ak 2008 vòt (3 kategori). Ak plis gwoup, chèchè yo te te espere ke li ta de pli zan pli posib ke nan chak gwoup, repons potansyèl te uncorrelated ak sipò pou Obama. Apre sa, olye ke konstwi pwa moun nan nivo, menm jan nou te fè nan egzanp nou an, Wang ak kòlèg itilize yon modèl konplèks yo estime pwopòsyon de moun nan chak gwoup ki ta vote pou Obama. Finalman, yo konbine sa yo estimasyon gwoup sipò ak gwosè a li te ye nan chak gwoup yo pwodwi yon nivo estime jeneral nan sipò. Nan lòt mo, yo koupe moute popilasyon an an gwoup diferan, estime sipò nan pou Obama nan chak gwoup, ak Lè sa te pran yon mwayèn weighted nan estimasyon yo gwoup yo pwodwi yon estimasyon an jeneral.

Kidonk, defi a gwo nan apwòch yo se yo estime sipò nan pou Obama nan chak nan 176.256 gwoup sa yo. Malgre ke panèl yo enkli 345.858 patisipan inik, yon nimewo gwo pa estanda yo nan biwo vòt eleksyon, te gen anpil moun, anpil gwoup pou ki Wang ak kòlèg te gen prèske pa gen okenn moun ki repond. Se poutèt sa, yo estime sipò nan nan chak gwoup yo te konn itilize yon teknik yo rele multi retou annaryè ak pòs-stratifikasyon, ki chèchè afeksyon rele Mesye P. Esansyèlman, yo estime sipò nan pou Obama nan yon gwoup espesifik, Mesye P. pisin enfòmasyon ki soti nan anpil pre relasyon gwoup. Pou egzanp, konsidere defi a nan estime sipò nan pou Obama nan mitan fi, panyòl, ant 18-29 ane fin vye granmoun, ki moun ki yo gradye kolèj, ki ap anrejistre Demokrat, ki moun ki pwòp tèt ou-idantifye kòm modere, ak ki te vote pou Obama nan 2008. Sa a se yon gwoup trè, trè espesifik, epi li se posib ke gen pèsonn nan echantiyon an ak karakteristik sa yo. Se poutèt sa, fè estimasyon sou gwoup sa a, Mesye P. pisin ansanm estime nan men moun nan gwoup trè sanblab.

Lè l sèvi avèk estrateji sa a analiz, Wang ak kòlèg te kapab sèvi ak ksboks ki pa pwobabilite echantiyon nan trè sere estime sipò a an jeneral ke Obama te resevwa nan eleksyon an 2012 (Figi 3.5). An reyalite estimasyon yo te pi egzak pase yon total nan biwo vòt opinyon piblik la. Kidonk, nan ka sa a, pondération-espesyalman Mesye P.-sanble yo fè yon bon travay korije prejije yo nan done ki pa pwobabilite; prejije ki vizib lè ou gade nan estimasyon yo soti nan done yo Xbox brut.

Figi 3.5: Estimasyon soti nan Wang et al. (2015). Brut echantiyon ksboks pwodwi estimasyon enkòrèk. Men, echantiyon an ksboks filaplon pwodwi estimasyon ki te pi egzak pase yon mwayèn de pwobabilite ki baze sou sondaj telefòn.

Figi 3.5: Estimasyon soti nan Wang et al. (2015) . Brut echantiyon ksboks pwodwi estimasyon enkòrèk. Men, echantiyon an ksboks filaplon pwodwi estimasyon ki te pi egzak pase yon mwayèn de pwobabilite ki baze sou sondaj telefòn.

Gen de leson prensipal yo soti nan etid la nan Wang ak kòlèg li. Premyèman, brut echantiyon ki pa pwobabilite ka mennen nan estimasyon move; sa a se yon leson ke anpil chèchè yo te tande anvan. Sepandan, leson an dezyèm se ke echantiyon ki pa pwobabilite, lè filaplon byen, ka aktyèlman pwodwi estimasyon byen bon. An reyalite, estimasyon yo te pi egzak pase estimasyon yo soti nan pollster.com, yon agrégation ki gen plis biwo vòt eleksyon tradisyonèl yo.

Finalman, gen limit enpòtan nan sa nou ka aprann nan yon sèl sa a etid espesifik. Jis paske pòs-stratifikasyon te travay byen nan ka sa a an patikilye, pa gen okenn garanti ke li pral travay byen nan lòt ka. An reyalite, eleksyon yo petèt youn nan anviwònman yo pi fasil paske sondeur yo te etidye eleksyon pou prèske 100 ane, gen regilye fidbak (nou ka wè ki moun ki ranport eleksyon yo), ak idantifikasyon pati ak karakteristik demografik yo relativman prediksyon nan vòt yo. Nan pwen sa a, nou manke teyori solid ak eksperyans anpirik konnen lè pondération ajisteman nan echantiyon ki pa pwobabilite yo pral pwodwi estimasyon ase egzat. Youn nan bagay ki te klè, sepandan, se si w ap fòse yo travay ak echantiyon ki pa pwobabilite, Lè sa a, se fò rezon ki fè nou kwè ke estimasyon ajiste pral pi bon pase estimasyon ki pa ajiste.