3.4.2 Ne-probablo specimenoj: ponderación

Tiu traduko estis kreitaj de komputilo. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Ne-probablo specimenoj: ponderación

Kun ne-probablo specimenoj, peziloj povas malfari distordoj kaŭzita de la supozitaj muestreo procezo.

En la sama vojo ke esploristoj pezo respondojn de probablo specimenoj, ili povas ankaŭ pesi respondojn de ne-probablo specimenoj. Ekzemple, kiel alternativo al la CPS, imagu ke vi metis standardo anoncoj sur miloj de retejoj varbi partoprenantojn por enketo por taksi la senlaboreco imposto. Nature, Vi devus esti skeptika ke la simpla meznombro de via specimeno estus bona takso de la senlaboreco imposto. Via escepticismo Eble vi pensas ke iuj personoj estas pli verŝajna por kompletigi vian enketon ol aliaj. Ekzemple, homo kiu ne elspezas multan tempon en la reto estas malpli verŝajna por kompletigi vian enketon.

Kiel ni vidis en la lasta sekcio, tamen, se ni scias kiel la specimeno estis elektita-kiel ni faras kun probablo specimenoj-tiam ni povas malfari distordoj kaŭzita de la muestreo procezo. Bedaŭrinde, kiam laborante kun ne-probablo specimenoj, ni ne scias kiel la specimeno estis elektita. Sed ni povas fari supozojn pri la muestreo procezo kaj tiam apliki ponderación en la sama maniero. Se tiuj supozoj estas ĝustaj, tiam la valoroj estos malfari la distordoj kaŭzita de la muestreo procezo.

Ekzemple, imagu ke en respondo al via standardo anoncoj, vi varbis 100,000 respondantoj. Tamen vi ne kredas, ke tiuj 100.000 respondantoj estas simpla hazarda specimeno de amerikaj plenkreskuloj. Fakte, kiam oni komparas vian respondantoj al la usona loĝantaro, vi trovas ke homoj el iuj statoj (ekzemple, Nov-Jorko) estas super-reprezentitaj kaj ke homoj de iuj statoj (ekzemple, Alasko) estas sub-reprezentitaj. Tiel, la senlaboreco kurzo de via specimeno verŝajne estas malbona takso de la senlaboreco imposto en la cela loĝantaro.

Unidirekta malfari la distordo kiu okazis en la muestreo procezo estas atribui pezoj por ĉiu persono; malaltaj pezoj al homoj el ŝtatoj kiuj super-reprezentitaj en la provaĵo (ekz, Nov-Jorko) kaj altaj pezoj al homoj el ŝtatoj kiuj sub-reprezentitaj en la provaĵo (ekz, Alasko). Pli specife, la pezon por ĉiu respondanto rilatas al ilia tropezo en via specimeno relativa al ilia tropezo en Usono loĝantaro. Tiu ponderación proceduro nomata post-tavoliĝo, kaj la ideo de pezo devus memorigi vin pri la ekzemplo en Sekcio 3.4.1 kie enketitaj de Rhode Island ricevis malpli peza ol la enketitaj de Kalifornio. Post-tavoliĝo postulas ke vi scias sufiĉe por meti vian respondantoj en grupojn kaj scii la proporcion de la cela loĝantaro en ĉiu grupo.

Kvankam la pezo de la probablo specimeno kaj de la ne-probablo specimeno estas samaj matematike (vidu teknika apendico), ili funkciis bone en malsamaj situacioj. Se la esploristo havas perfektan probablo specimeno (te, neniu priraportado eraro kaj neniu ne-respondo), tiam ponderación produktos nedekliva taksoj por ĉiuj trajtoj en ĉiuj kazoj. Tiun fortan teorian garantio Tial rekomendantoj de probablo specimenoj trovi ilin tiel alloga. Aliflanke, ponderación ne- probablo specimenoj nur produktos nedekliva taksoj por ĉiuj trajtoj se la respondo propensiones estas la sama por ĉiuj en ĉiu grupo. Alivorte, pensante al nia ekzemplo, uzante post-tavoliĝo produktos nedekliva taksoj se ĉiuj en Nov-Jorko havas la saman probablon de partoprenanta kaj ĉiuj en Alasko havas la saman probablon de partopreni kaj tiel plu. Tiu supozo estas nomita la homogena-respondo-propensiones-ene-grupoj supozo, kaj ĝi ludas ŝlosilan rolon en scii se post-tavoliĝo laboros bone kun ne-probablo specimenoj.

Bedaŭrinde, en nia ekzemplo, la homogena-respondo-propensiones-ene-grupoj supozo ŝajnas neverŝajna esti vera. Tio estas, ĝi ŝajnas neverŝajna ke ĉiuj en Alasko havas la saman probablon de esti en via enketo. Sed, estas tri gravaj punktoj teni en menso pri post-tavoliĝo, ĉiuj el kiuj faras ĝin ŝajni pli promesplena.

Unua, homogena-respondo-propensiones-ene-grupoj supozo fariĝas pli kredebla kiel la nombro de grupoj pliigas. Kaj, esploristoj ne estas limigitaj al grupoj simple bazitaj sur ununura geografia dimensio. Ekzemple, ni povus krei grupojn surbaze stato, aĝo, sekso, kaj eduknivelo. Ŝajnas pli kredebla, ke estas homogena respondo propensiones ene de la grupo de 18-29, ino, kolegio diplomitoj vivantaj en Alasko ol ene de la grupo de ĉiuj homoj vivantaj en Alasko. Tiel, kiel la nombro de grupoj uzata por post-tavoliĝo pliigas, la supozoj bezonataj por apogi ŝin fariĝi pli modera. Donita ĉi tiu fakto, ĝi ŝajnas kiel esploristoj volus krei grandegan numeron de grupoj por post-tavoliĝo. Sed, kiel la nombro de grupoj pliigas, esploristoj kolizii alian problemon: datumoj malmulteco. Se estas nur malgranda nombro de homoj en ĉiu grupo, tiam la taksoj estos pli malcerta, kaj en la ekstrema kazo kie estas grupo kiu ne havas respondantoj, tiam post-tavoliĝo tute rompiĝas. Estas du manieroj de tiu imanenta streĉiĝo inter la verosimilitud de homogeneous- respondo-propensión-ene-grupoj supozo kaj la postulo je racia specimenon grandecoj en ĉiu grupo. Unu aliro estas movi al pli sofistika statistika modelo por kalkulanta pezoj kaj la aliaj estas kolekti pli granda, pli diversa specimeno, kiu helpas certigi racian specimenon grandecoj en ĉiu grupo. Kaj, kelkfoje esploristoj fari ambaŭ, kiel mi priskribi pli detale sube.

Dua konsidero kiam laboranta kun post-tavoliĝo de ne-probablo specimenoj estas ke la homogena-respondo-propensión-ene-grupoj supozo jam ofte faris kiam analizanta probablo specimenoj. La kialo ke tiu supozo estas necesa por probablo specimenoj en praktiko estas ke probablo specimenoj havas ne-respondo, kaj la plej komuna metodo por ĝustigi por ne-respondo estas post-tavoliĝo kiel priskribita supre. Kompreneble, nur ĉar multaj esploristoj fari certa supozo ne signifas ke vi devus fari ĝin tro. Sed, ĝi signifas ke kiam komparanta ne- probablo specimenoj al probablo specimenoj en praktiko, ni devas teni en menso ke ambaŭ dependas supozoj kaj helpajn informojn por produkti taksojn. En plej realisma difinoj, ekzistas simple neniu supozo-libera alproksimiĝo al konkludo.

Fine, se vi zorgas pri unu takso aparte -en nia ekzemplo senlaboreco imposto-tiam vi bezonos kondiĉo malforta ol homogena-respondo-propensión-ene-grupoj supozo. Specife, ke vi ne bezonas supozi ke ĉiu havas la saman respondon propensión, vi nur bezonas supozi ke ekzistas neniu korelacio inter respondo propensión kaj senlaboreco imposto ene de ĉiu grupo. Kompreneble, eĉ tiu malforta kondiĉo ne teni en iuj situacioj. Ekzemple, imagu taksanta la proporcio de amerikanoj kiuj faras volontula laboro. Se homoj kiuj faras volontula laboro estas pli verŝajna konsentas esti en enketo, do esploristoj volas sisteme super-taksi la kvanton de volontulado, eĉ se ili faras post-tavoliĝo retuŝoj, rezulto kiu estis pruvita empirie de Abraham, Helms, and Presser (2009) .

Kiel mi diris antaŭe, ne-probablo specimenoj estas rigardita kun granda skeptiko fare sociaj sciencistoj, parte pro sia rolo en iuj de la plej hontinda fiaskoj en la fruaj tagoj de enketo esplorado. Klara ekzemplo de kiom for ni venis kun ne-probablo specimenoj estas la esploro de Wei Wang, David Rothschild, Sharad Goel, kaj Andrew Gelman ke ĝuste reakiris la rezulton de la 2012 usona balotado uzanta ne-probablo specimeno de usonaj Xbox uzantoj -a decideme ne-hazarda specimeno de usonanoj (Wang et al. 2015) . La esploristoj varbis enketitaj de la XBox ludoj sistemo, kaj kiel vi povus atendi, la Xbox specimeno skewed masklo kaj skewed juna: 18 - 29 Jaro olds konsistigas 19% de la balotantaro sed 65% de la Xbox specimeno kaj viroj konsistigas 47% de la elektantaro kaj 93% de la Xbox specimeno (Figuro 3.4). Pro tiuj fortaj demografiaj parcialidades, la kruda Xbox datumoj estis malriĉa indikilo de elekto revenoj. Antaŭdiris forta venko por Mitt Romney super Barack Obama. Denove, ĉi tio estas alia ekzemplo de la danĝeroj de kruda, unadjusted ne- probablo specimenoj kaj estas rememoriga pri la Literary Digest fiasko.

Figuro 3.4: Demografio de respondantoj en Wang et al. (2015) . Ĉar respondantoj estis varbitaj de XBox, ili estis pli verŝajna al esti juna kaj pli verŝajna al esti vira, relative al balotantoj en la 2012 elekto.

Tamen Wang kaj kolegoj estis konscia pri tiuj problemoj kaj penis pezo la enketitaj korekti la muestreo procezo. Aparte, ili uzis pli kompleksan formon de la post-tavoliĝo mi parolis al vi. Ĝi estas lingvo lernebla iom pli pri ilia alproksimiĝo ĉar ĝi konstruas intuicio pri post-tavoliĝo, kaj la aparta versio Wang kaj kolegoj uzis estas unu el la plej ekscitaj aliroj al ponderación ne- probablo specimenoj.

En nia simpla ekzemplo pri taksanta senlaboreco en Sekcio 3.4.1, ni dividis la loĝantaro en grupojn surbaze stato de restadejo. En kontrasto, Wang kaj kolegoj dividis la loĝantaro en en 176.256 grupoj difinitaj de: sekso (2 kategorioj), raso (4 kategorioj), o (4 kategorioj), edukado (4 kategorioj), ŝtato (51 kategorioj), partio ID (3 kategorioj), ideologio (3 kategorioj) kaj 2008 voĉdono (3 kategorioj). Kun pli grupoj, la esploristoj esperas ke estus pli probable ke en ĉiu grupo, respondo propensión estis nekorelaciigita kun subteno por Obama. Sekva, anstataŭ konstrui individua nivelo pezoj, kiel ni faris en nia ekzemplo, Wang kaj kolegoj uzis kompleksan modelon por taksi la proporcion de homoj en ĉiu grupo kiu voĉdonus por Obama. Fine, ili kombinis tiujn grupo taksoj de apogo kun la konata grandeco de ĉiu grupo por produkti laŭtaksan totalan nivelon de subteno. Alivorte, ili hakis la loĝantaro en malsamaj grupoj, taksis la subtenon por Obama en ĉiu grupo, kaj tiam prenis pezbalancitan mezumon de la grupo taksoj produkti entutan takson.

Tiel, la granda defio en lia alproksimiĝo estas taksi la subtenon por Obama en ĉiu de ĉi tiuj 176.256 grupoj. Kvankam ilia panelo inkludas 345.858 solaj partoprenantoj, grandega nombro de la normoj de elekto voĉdonado, estis multaj, multaj grupoj por kiuj Wang kaj kolegoj havis preskaŭ nenian respondantoj. Do taksi la apogon en ĉiu grupo uzis teknikon nomita multinivel malprogreso kun post-tavoliĝo, kiu esploristoj ame nomas Mr. P. Esence, taksi la subtenon por Obama ene de specifa grupo, Mr. P. lagojn informoj el multaj parenca grupoj. Ekzemple, konsideru la defio de taksanta la subtenon por Obama inter ino, hispanoj, inter 18-29 jaroj, kiuj estas universitato diplomitoj, kiuj estas registritaj demokratoj, kiuj mem-identigas kiel moderuloj, kaj kiuj voĉdonis por Obama en 2008. Tiu estas tre, tre specifa grupo, kaj ĝi eblas kiu ekzistas neniu en la specimeno kun tiuj karakterizaĵoj. Sekve, fari taksojn pri tiu grupo, Mr. P. naĝejoj kune taksoj de personoj en tre similaj grupoj.

Uzante tiu analizo strategio, Wang kaj kolegoj povis uzi la XBox ne- probablo specimeno al tre proksime taksi la entuta subteno ke Obama ricevis en la 2012 elekto (Figuro 3.5). Fakte iliaj taksoj estis pli preciza ol agregaĵo de publika opinio balotoj. Tiel, en tiu kazo, ponderación-specife Mr. P.-ŝajnas fari bonan laborpostenon korektante la antaŭjuĝoj en ne-probablo datumoj; antaŭjuĝoj kiuj estas videbla kiam vi rigardas la taksojn de la unadjusted Xbox datumoj.

Figuro 3.5: Taksoj de Wang et al. (2015) . Unadjusted XBox specimeno produktis malpreciza taksoj. Sed, la pezita XBox specimeno produktis taksoj kiu estis pli preciza ol mezumo de probablo-bazitaj telefonaj enketoj.

Estas du ĉefaj lecionoj de la studo de Wang kaj kolegoj. Unue unadjusted ne- probablo specimenoj povas konduki al malbona taksoj; tio estas leciono ke multaj esploristoj aŭdis antaŭe. Tamen, la dua leciono estas ke ne-probablo specimenoj, kiam weighted konvene, povas reale produktas tre bonaj taksoj. Fakte, iliaj taksoj estis pli preciza ol la taksoj de pollster.com, kungregigxinte de pli tradicia elekto balotenketoj.

Fine, ekzistas gravaj limigoj al kion ni povas lerni de ĉi tiu specifa studo. Nur ĉar post-tavoliĝo funkciis bone en tiu aparta kazo, estas nenia garantio, ke ĝi bone funkcias en aliaj kazoj. Fakte, elektoj estas eble unu el la plej facilaj agordojn ĉar opinisondistoj estis studante elektoj por preskaŭ 100 jaroj, estas regula sugestoj (povas vidi kiu gajnas la elektojn), kaj partio identigo kaj demografiaj karakterizaĵoj estas relative predictiva de balotado. Ĉe tiu punkto, ni malhavas solidan teorio kaj empiria sperto scii kiam ponderación ĝustigas al ne-probablo specimenoj produktos sufiĉe precizaj taksoj. Unu afero kiu estas klara, tamen, estas se vi estas devigita labori kun ne-probablo specimenoj, tiam tie estas forta kialo por kredi ke ĝustigis taksoj estos bona ol ne-alĝustiĝi taksoj.