3.4.2 Non-líkindaúrtökum: vægi

Með sýnum ekki líkur, þyngd geta losa röskun af völdum ráð fyrir sýnatöku ferli.

Á sama hátt og vísindamenn þyngd svör úr sýnum líkur, þeir geta einnig þyngd svör frá sýnum ekki líkur. Til dæmis, í stað þess að SUV, ímynda sér að þú settir auglýsingaborða á þúsundum vefsíðna til að ráða þátttakendur könnun til að meta atvinnuleysi. Auðvitað, myndir þú vera efins um að einfalda meðaltal sýnishorn væri góð mat á atvinnuleysi. efahyggja er líklega vegna þess að þú heldur að sumir eru líklegri til að ljúka könnun en aðrir. Til dæmis, fólk sem eyðir ekki miklum tíma á vefnum eru ólíklegri til að ljúka könnun.

Eins og við sáum í síðasta kafla, hins vegar, ef við vitum hvernig úrtakið var valið, eins og við gerum með líkindaúrtökum-þá getum við lagað mistökin röskun af völdum sýnatöku ferli. Því miður, þegar unnið er með sýnum ekki líkur, við vitum ekki hvernig úrtakið var valið. En getum við gert ályktanir um sýnatöku ferli og þá gilda vægi á sama hátt. Ef þessar forsendur eru réttar, þá vægi mun losa röskun af völdum sýnatöku ferli.

Til dæmis ímynda sér að bregðast við auglýsingar borði þínu, þú ráðinn 100.000 svarenda. Hins vegar telur þú ekki að þessi 100.000 svarendur eru einföld slembiúrtak af American fullorðna. Í raun, þegar þú bera saman svarendur til bandarísku þjóðarinnar, þú finnur að fólk frá sumum ríkjum (td New York) eru í meirihluta og að fólk frá sumum ríkjum (td Alaska) eru í minnihluta. Þannig var atvinnuleysi sýnishorn er líklegt til að vera slæm mat á atvinnuleysi í markhópnum.

Ein leið til að losa röskun sem gerðist í sýnatöku aðferð er að úthluta lóðum fyrir hvern einstakling; lægri þyngd til fólks frá ríkjum sem eru yfir-fulltrúa í sýninu (td New York) og hærri þyngd til að fólk frá ríkjum sem eru í minnihluta í sýninu (td Alaska). Nánar tiltekið þyngd hvers svaranda er tengjast algengi þeirra í úrtaki miðað til algengi þeirra í Bandaríkjunum íbúa. Þetta vægi aðferð er kölluð eftir Lagskipting, og hugmyndin um vigtun ætti að minna þig á að td í kafla 3.4.1 þar sem svarendur frá Rhode Island fengu minna vægi en svarendur frá Kaliforníu. Post-lagskipting krefst þess að þú veist nóg til að setja svarenda í hópa og að vita hlutfall af markhópnum í hverjum hópi.

Þótt vægi líkindadreifingar- sýnisins og ekki líkur sýni eru sömu stærðfræðilega (sjá tæknilega viðbætinum), vinna þeir vel í mismunandi aðstæður. Ef rannsakandi hefur fullkomið líkur sýni (þ.e. engin umfjöllun villa og ekkert utan response), þá mun vægi framleiða óhlutdræg áætlanir fyrir alla eiginleika í öllum tilvikum. Þessi sterka fræðilega ábyrgð er ástæðan talsmenn sýnum líkur finna þá svo aðlaðandi. Á hinn bóginn, sem vógu ekki líkindaúrtökum mun einungis framleiða óhlutdræg áætlun fyrir alla eiginleika sem ef svörun propensities eru þau sömu fyrir í hverjum hópi alla. Með öðrum orðum, hugsa til baka til dæmis okkar, með því að nota post-lagskipting mun framleiða óhlutdræg áætlunum ef í New York allir eru sömu líkur á að taka þátt og í Alaska allir eru sömu líkur á því að taka þátt og svo framvegis. Þessi forsenda er kallað einsleitari-svar-hneigð-innan-hópa forsendu, og það gegnir lykilhlutverki í að vita ef eftir lagskipting vilja vinna vel með sýnum ekki líkur.

Því miður, í dæmi okkar, einsleitt og svörunar-hneigð-innan-hópa forsenda virðist ólíklegt að vera satt. Það er, það virðist ólíklegt að í Alaska allir hafi sömu líkur á því að vera í könnuninni þinni. En, það eru þrjú mikilvæg atriði til að hafa í huga um eftirvinnslu lagskiptingu, sem öll gera það virðast fleiri vænleg.

First, einsleitt og svörunar-hneigð-innan-hópa forsendu verður meira plausible og fjölda hópa eykst. Og, eru vísindamenn ekki takmarkaðar við bara byggt á einni landfræðilegum vídd. Til dæmis gætum við búið til hópa á grundvelli stöðu, aldri, kyni, og menntunarstig. Það virðist meira plausible að það er einsleitari propensities svörun innan hóps 18-29, kvenkyns, háskóli útskriftarnema sem býr í Alaska en innan hópsins allra sem búa í Alaska. Svona, eins og fjöldi hópa sem notuð fyrir eftir lagskiptingarþátta eykst forsendur sem þarf til að styðja það verða meira sanngjarnt. Í ljósi þessa staðreynd, það virðast eins og a vísindamenn myndu vilja búa til a gríðarstór tala af hópum fyrir eftir lagskiptingu. En, eins og fjöldi hópa eykst, vísindamenn hlaupa inn í aðra vandamál: gögn sparsity. Ef það eru aðeins lítill fjöldi fólks í hverjum hópi, þá áætlun verður að vera meiri óvissa, og í versta falli þar er hópur sem hefur ekki svarendur, þá eftir lagskipting brýtur alveg niður. Það eru tvær leiðir út úr þessu felast spennu milli trúverðugleika homogeneous- svar-tilhneiging-innan-hópa forsendu og eftirspurn eftir sanngjörnu stærðum sýni í hverjum hópi. Ein aðferð er að flytja til flóknari reiknilíkan til að reikna út þyngd og hitt er að safna stærri, fjölbreyttari sýni, sem hjálpar að tryggja eðlilegar jafnstóra í hverjum hópi. Og stundum vísindamenn gera bæði, eins og ég lýsa nánar hér fyrir neðan.

Annað huga þegar unnið er með eftirvinnslu lagskiptingu úr sýnum ekki líkur er að einsleit-svar-tilhneiging-innan-hópa forsenda er nú oft gert þegar greina líkindaúrtökum. Ástæðan fyrir því að þessi forsenda er þörf fyrir sýni líkur í reynd er að líkindaúrtökum hafa brottfalli, og algengasta aðferðin til að stilla til brottfalls er eftir lagskipting eins og lýst er hér að ofan. Auðvitað, bara vegna þess að margir vísindamenn gera ákveðna forsendu þýðir ekki að þú ættir að gera það líka. En, það þýðir að þegar samanburður ekki líkindaúrtökum sýni líkur í reynd, verðum við að hafa í huga að bæði ráðast á forsendum og tengd upplýsingum í því skyni að framleiða mat. Í mest raunhæf stillingum, það er einfaldlega ekki forsenda ókeypis nálgun til ályktun.

Að lokum, ef þér þykir vænt um aðra áætlun, einkum í dæmi atvinnuleysi okkar hraða-þá þarftu ástand veikari en einsleitar-svar-tilhneigingu-innan-hópa forsendu. Nánar tiltekið, þú þarft ekki að gera ráð fyrir að allir hafi sömu viðbrögð tilhneigingu, þú þarft aðeins að gera ráð fyrir að það er engin fylgni á milli svörunar tilhneigingu og atvinnuleysi innan hvers hóps. Auðvitað, jafnvel þessi veikari ástand mun ekki halda í sumum tilfellum. Til dæmis ímynda sér að meta hlutfall Bandaríkjamanna sem gera sjálfboðavinnu. Ef fólk sem gera sjálfboðavinnu eru líklegri til að samþykkja að vera í könnun, þá vísindamenn markvisst yfir meta magn af sjálfboðavinnu, jafnvel ef þeir gera eftir lagskiptingu breytingar, niðurstöðu sem sýnt hefur verið fram tilraunum með Abraham, Helms, and Presser (2009) .

Eins og ég sagði áðan, eru sýni ekki líkur skoðað með mikilli tortryggni félagslegra vísindamanna, að hluta til vegna þess að hlutverk þeirra í sumir af the vandræðaleg mistök í árdaga könnun rannsókna. Skýr dæmi um hversu langt við höfum komið með sýnum ekki líkur er rannsóknir Wei Wang, David Rothschild, Sharad Goel, og Andrew Gelman sem rétt batna niðurstöðu 2012 bandaríska kosningarnar notar ekki líkur sýni af American Xbox notendur -a decidedly ekki slembiúrtak Bandaríkjamanna (Wang et al. 2015) . Rannsakendur ráðnir svarenda úr XBox gaming kerfi, og eins og þú might búast við, að Xbox sýni skekkt karl og skekkt ung: 18 - 29 ára gera upp 19% af kjósendum en 65% af Xbox sýni og menn gera upp 47% kjósenda og 93% af Xbox sýninu (mynd 3.4). Vegna þessara sterku lýðfræðilega hlutdrægni, hrár Xbox gögnin var fátækur vísbending um ávöxtun kosningum. Það spáð sterka sigur fyrir Mitt Romney yfir Barack Obama. Aftur, þetta er annað dæmi um hættur hráefni, Óleiðréttur ekki líkindaúrtökum og minnir á Literary Digest misheppnað tiltæki.

Mynd 3.4: Lýðfræði svarenda í Wang et al. (2015). Vegna svarendur voru ráðnir af XBox, voru þeir líklegri til að vera ungur og líklegri til að vera karlmaður, miðað við kjósendur í 2012 kosningum.

Mynd 3.4: Lýðfræði svarenda í Wang et al. (2015) . Vegna svarendur voru ráðnir af XBox, voru þeir líklegri til að vera ungur og líklegri til að vera karlmaður, miðað við kjósendur í 2012 kosningum.

Hins vegar Wang og samstarfsmenn voru meðvitaðir um þessi vandamál og reynt að þyngd svarenda að leiðrétta fyrir sýnatöku ferli. Einkum notað þau flóknari form eftir lagskiptingu ég sagði þér frá. Það er þess virði að læra aðeins meira um nálgun þeirra vegna þess að það byggir innsæi um eftir lagskiptingu, og einkum útgáfu Wang og samstarfsmenn notað er eitt af mest spennandi aðferðir til vægi ekki líkindaúrtökum.

Í einföldu dæmi okkar um mat atvinnuleysi í kafla 3.4.1, skipt við íbúa í hópa á grundvelli stöðu búsetu. Í mótsögn, Wang og samstarfsmenn skipt á íbúa í í 176,256 hópa skilgreind með: kyni (2 flokkar), kynþætti (4 flokkar), aldri (4 flokkar), menntun (4 flokkar), ástand (51 flokkar), aðila ID (3 flokkar), hugmyndafræði (3 flokkar) og 2008 atkvæði (3 flokkar). Með fleiri hópum, sem vísindamenn vonast til að það væri sífellt líklegt að innan hvers hóps, svar tilhneiging var uncorrelated með stuðning fyrir Obama. Næst, frekar en að byggja einstaklingur stigi lóð, eins og við gerðum í okkar dæmi, Wang og samstarfsmenn notaði flókið líkan til að meta hlutfall fólks í hverjum hópi sem myndi gefa fyrir Obama. Að lokum, sameina þeir þetta áætlar samstæðan stuðning við þekkt stærð hvers hóps til að framleiða áætlaðar heildar stuðning. Með öðrum orðum, hakkað þeir upp á íbúa í mismunandi hópa, áætlað stuðning Obama í hverjum hóp, og þá tók á vegnu meðaltali áætlar samstæðan að framleiða heildarmat.

Svona, stór áskorun í nálgun þeirra er að meta stuðning Obama í hverjum þessara 176,256 hópa. Þó spjaldið sitt með 345,858 einstaka þátttakendur, a gríðarstór tala af stöðlum kosningum fræva, það voru margir, margir hópar sem Wang og samstarfsmenn hafði næstum engin svarenda. Því að meta stuðning í hverjum hópi þeir notuðu tækni sem kallast multilevel afturför með eftir lagskiptingu, sem vísindamenn kærleiksþel kalla Mr. P. meginatriðum, að meta stuðning Obama innan tiltekins hóps, Mr. P. sundlaugar upplýsingar frá mörgum nátengd hópa. Til dæmis, íhuga áskorun um að meta stuðning Obama meðal kvenna, Hispanics, milli 18-29 ára, sem eru í háskóla útskriftarnema, sem skráðir eru demókratar, sem sjálf-þekkja sem moderates, og sem kusu Obama árið 2008. Þetta er mjög, mjög sérstakur hópur, og það er mögulegt að það er enginn í sýninu sem hefur þessa eiginleika. Því að gera áætlanir um þennan hóp, Mr. P. sundlaugar áætlar saman frá fólki í mjög svipuðum hópum.

Using this greiningu stefnu, Wang og samstarfsmenn gátu til að nota Xbox ekki líkur sýni að mjög náið meta heildar stuðning sem Obama berast í 2012 kosningum (Mynd 3.5). Í raun mat þeirra voru nákvæmari en samanlagt opinberra skoðanakönnunum. Svona, í þessu tilfelli, vægi-sérstaklega Mr. P.-virðist gera gott starf að leiðrétta hlutdrægni í gögnum sem ekki líkur; bjagi sem eru sýnilegar þegar þú horfir á áætlunum frá Óleiðréttur gögnum Xbox.

Mynd 3,5: áætlanir út frá Wang et al. (2015). Óleiðréttur XBox sýni framleitt ónákvæmar áætlanir. En, vegið XBox sýni framleitt mat sem voru nákvæmari en að meðaltali líkur byggir könnunum síma.

Mynd 3,5: áætlanir út frá Wang et al. (2015) . Óleiðréttur XBox sýni framleitt ónákvæmar áætlanir. En, vegið XBox sýni framleitt mat sem voru nákvæmari en að meðaltali líkur byggir könnunum síma.

Það eru tveir helstu lærdóm af rannsókn á Wang og samstarfsmenn. First, unadjusted ekki líkindaúrtökum getur leitt til slæmra áætlun; þetta er lexía sem margir vísindamenn hafa heyrt áður. Hins vegar er annað lærdómurinn er að ekki líkindaúrtökum, þegar vegið réttan hátt, getur í raun framleiða alveg góðar áætlanir. Í raun, mat þeirra voru nákvæmari en áætlun frá pollster.com, sem samsafn af fleiri hefðbundnum kannanir kosningum.

Loks eru mikilvægar takmarkanir á hvað við getum lært af þessum eina tiltekna rannsókn. Bara vegna þess að eftir lagskipting unnið vel í þessu tiltekna tilviki, það er engin trygging fyrir því að það mun virka vel í öðrum tilvikum. Í raun, kosningar eru kannski einn af the auðveldlega stillingar vegna pollsters hafa verið að læra kosningar fyrir næstum 100 árum, það er venjulegur viðbrögð (við getum séð hver vinnur kosningar), og aðila auðkenningu og lýðfræðileg einkenni eru tiltölulega forspárgildi um atkvæðagreiðslu. Á þessum tímapunkti, skortir við traustan kenningar og empirical reynslu til að vita hvenær sem vega aðlögun sýnum ekki líkur mun framleiða nægilega nákvæmar áætlanir. Eitt sem er þó ljóst er, ef þú neyðist til að vinna með sýni ekki líkur, þá er það mikil ástæða til að ætla að leiðrétt áætlun verður að vera betri en non-leiðrétt áætlun.