3.4.2 Non-verjetnostni vzorci: ponderiranja

Ta prevod je bil ustvarjen s pomočjo računalnika. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Non-verjetnostni vzorci: ponderiranja

Z non-verjetnostnih vzorcih, lahko uteži razveljavite izkrivljanj zaradi domnevnega postopku vzorčenja povzročajo.

Na enak način, da raziskovalci in težo odzive iz verjetnostne vzorcev, ki jih lahko tudi teže odzive od zunaj verjetnostnih vzorcih. Na primer, kot alternativo k CPS, si predstavljajte, da ste postavili oglasne pasice na tisoče spletnih strani zaposliti kandidatov za raziskavo, se oceni stopnjo brezposelnosti. Seveda bi bili skeptični, da bi bila preprosta sredina vašega vzorca dober približek stopnje brezposelnosti. Vaš skepticizem je verjetno zato, ker menite, da so nekateri ljudje bolj verjetno, da bi opravili anketo kot drugi. Na primer, ljudje, ki ne preživijo veliko časa na spletu, je manj verjetno, da bi opravili anketo.

Kot smo videli v zadnjem delu pa, če vemo, kako je bila izbrana, saj je vzorec naredimo z verjetnostnih vzorcih, potem lahko razveljavite izkrivljanje po postopku vzorčenja povzročila. Na žalost, ko delajo z ne-verjetnosti vzorcev, ne vemo, kako je bil izbran vzorec. Ampak, lahko naredimo predpostavke o postopku vzorčenja in potem utež na enak način. Če so te domneve pravilne, potem bo ponder razveljavite izkrivljanje po postopku vzorčenja povzročila.

Na primer, si predstavljajte, da v odgovor na vaše oglasne pasice, ki jih zaposlujejo 100.000 anketirancev. Vendar pa ne verjamem, da so ti 100.000 anketirancev preprost naključni vzorec ameriških odraslih. V bistvu, ko primerjajo svoje anketirance, da prebivalstvo ZDA, boste ugotovili, da so ljudje iz nekaterih državah (na primer New York) več zastopane in da ljudje iz nekaterih državah (na primer, Alaska) so premalo zastopane. Tako se je stopnja brezposelnosti vašega vzorca, je verjetno, da bo slaba ocena stopnje brezposelnosti v ciljni populaciji.

Eden od načinov, da razveljavite izkrivljanje, ki se je zgodilo v postopku vzorčenja je, da se dodeli uteži za vsako osebo; nižje uteži za ljudi iz držav, ki so prekomerno zastopane v vzorcu (npr, New York) in večjo telesno maso do ljudi iz držav, ki so premalo zastopane v vzorcu (npr Alaska). Natančneje, je teža za vsakega anketiranca glede njihove razširjenosti v vzorec glede na njihovo razširjenost v populaciji ZDA. Ta postopek ponder se imenuje po stratifikacija, in ideja tehtanje naj bi vas spomnil na primer v poglavju 3.4.1, kjer so anketiranci iz Rhode Island pripisuje manjši pomen kot anketiranci iz Kalifornije. Post-stratifikacija zahteva, da veš dovolj, da svoje anketirance v skupine in vedeti delež ciljne populacije v vsaki skupini.

Čeprav je tehtanje na verjetnostnem vzorcu in ne-verjetnostnem vzorcu enako matematično (glej tehnično prilogo), delajo tudi v različnih situacijah. Če ima raziskovalec odlično verjetnostnega vzorca (tj brez napak pokritost in ne neodgovorov), potem bo ponder pripravi nepristranskih ocen za vse lastnosti v vseh primerih. Ta močna teoretična garancija zato zagovorniki verjetnostnih vzorcih zdijo tako privlačne. Po drugi strani pa bo ponder, non-verjetnostni vzorci proizvajajo samo nepristranskih ocen za vse lastnosti, če so se nagnjenj odziva za vse enako v vsaki skupini. Z drugimi besedami, razmišljanje nazaj v našem primeru, s pomočjo post-stratifikacije bo prineslo nepristranske ocene, če ima vsakdo v New Yorku enaka verjetnost, da sodelujejo in vsi na Aljaski ima enako verjetnost sodelujejo in tako naprej. Ta predpostavka se imenuje domnevo, homogene-odzivni-nagnjenj-v-skupin, in igra ključno vlogo pri vedo, ali bodo po stratifikacija dobro sodelujejo z ne-verjetnostnih vzorcih.

Na žalost, v našem primeru je predpostavka homogena odziva-nagnjenj-v-skupin se zdi malo verjetno, da bi bilo res. To pomeni, da je malo verjetno, da ima vsakdo na Aljaski enako verjetnost, da so v svoji raziskavi. Vendar pa obstajajo tri pomembne točke, ki vodijo v mislih o post-stratifikacije, kar vse bi bilo videti bolj obetavne.

Prvič, homogena odziva-nagnjenj-v-skupin predpostavka postane bolj verjetna kot število skupin narašča. In so raziskovalci niso omejene na skupine, samo na osnovi enega samega geografskega razsežnosti. Na primer, lahko ustvarimo skupine glede na stanje, starost, spol in stopnjo izobrazbe. Zdi se bolj verjetno, da je homogene nagnjenj odziva v skupini 18-29, ženska, diplomirani živijo na Aljaski kot v skupini vseh ljudi, ki živijo na Aljaski. Tako, kot je število skupin, ki se uporabljajo za post-stratifikacije povečuje, predpostavke, potrebne za podporo postalo bolj smiselno. Glede na to dejstvo, da se zdi, kot da bi raziskovalci želeli ustvariti veliko število skupin za post-stratifikacije. Ampak, saj je število skupin narašča, raziskovalci vodijo v drug problem: podatkov pičlost. Če gre samo za majhno število ljudi v vsaki skupini, nato pa bodo ocene bolj negotova, in v skrajnem primeru, ko je skupina, ki nima anketirancev, nato pa po stratifikaciji popolnoma pokvari. Obstajata dva načina, od tega prirojenega napetosti med verodostojnosti homogeneous- odziv-nagnjenost-v-skupin predpostavki in povpraševanje po razumnih velikosti vzorcev v vsaki skupini. Ena možnost je, da se premaknete na bolj prefinjen statističnega modela za izračun uteži in drugi je zbrati večjo, bolj raznoliko vzorec, ki pomaga zagotoviti primerne velikosti vzorcev v vsaki skupini. In včasih raziskovalci narediti tako, kot bom opisati podrobneje spodaj.

Drugi dejavnik pri delu z post-stratifikacije iz držav nečlanic verjetnostnih vzorcih je, da je predpostavka, homogena-odziv-nagnjenost-v-skupine že večkrat je pri analizi verjetnosti vzorcev. Razlog, da je potrebno ta predpostavka za verjetnostnih vzorcih v praksi, je, da imajo verjetnostni vzorci ne-odgovor, in najbolj običajna metoda za prilagoditev za neodgovor je post-stratifikacije, kot je opisano zgoraj. Seveda, samo zato, ker mnogi raziskovalci neka predpostavka ne pomeni, da bi morali to storiti tudi. Toda, ali to pomeni, da primerjava ni verjetnosti vzorce, verjetnostnih vzorcih v praksi, moramo imeti v mislih, da je tako odvisna od predpostavk in pomožne informacije, da se pripravijo ocene. V večini realnih okoljih, preprosto ni pristop domneva, svobodno sklepanje.

Končno, če vas skrbi približno eno oceno, zlasti, v našem primer brezposelnosti stopnji, potem morate stanje slabše kot homogene-odzivni-nagnjenosti-v-skupine predpostavki. Natančneje, vam ni treba predpostaviti, da ima vsakdo enako odzivni nagnjenost, morate le, da predpostavimo, da ni nobene povezave med odziva nagnjenost in stopnje brezposelnosti v vsaki skupini. Seveda tudi ta šibkejši pogoj ne bo imel v nekaterih situacijah. Recimo, da oceni delež Američanov, ki se prostovoljno delo. Če so ljudje, ki ne prostovoljno delo bolj verjetno, da se strinjajo, da je v raziskavi, nato raziskovalci bodo sistematično precenjujejo količino prostovoljstva, tudi če delajo prilagoditve post-stratifikacije, rezultat, ki se dokazano empirično jih Abraham, Helms, and Presser (2009) .

Kot sem že rekel, so non-verjetnostni vzorci obravnavati z veliko skepso sociologi, deloma zaradi svoje vloge v nekaterih najbolj neprijetno napak v prvih dneh anketnega raziskovanja. Jasen primer tega, kako daleč smo prišli z non-verjetnostnih vzorcih je raziskava Wei Wang, David Rothschild, Sharad Goel, in Andrew Gelman da pravilno vrniti izid ameriške volitve 2012 z uporabo non-verjetnostnem vzorcu uporabnikov Ameriški Xbox -a nedvomno niso naključni vzorec Američanov (Wang et al. 2015) . Z raziskovalci, zaposlenimi anketiranci iz igralnega sistema Xbox, in kot bi lahko pričakovali, Xbox vzorec nagnjen moški in nagnjen mlade: 18-29 letniki, predstavljajo 19% volilnega telesa, ampak 65% vzorca Xbox in so moški 47% volivcev in 93% Xbox vzorca (slika 3.4). Zaradi teh močnih demografskih odstopanj je bilo neobdelanih podatkov Xbox slab pokazatelj volilnih napovedi. To napovedujejo močno zmago Mitt Romney nad Barackom Obamo. Tudi to je še en primer nevarnosti surovin, neprilagojenih ne verjetnostnih vzorcih in spominja na Literary Digest polom.

Slika 3.4: Demografski podatki anketirancev v Wang et al. (2015) . Ker so bili anketiranci zaposleni iz Xbox, so bolj verjetno, da bodo mladi in bolj verjetno, da bo moški, glede na volivci na volitvah 2012.

Vendar pa so bili Wang in sodelavci zaveda teh težav in poskušal težo anketirancev popraviti za postopek vzorčenja. Zlasti se uporabljajo bolj prefinjene oblike post-stratifikacije sem ti govoril. To je vredno učenja malo več o svojem pristopu, saj gradi intuicijo o post-stratifikacije, in zlasti različica Wang in sodelavci uporablja, je eden izmed najbolj zanimivih pristopov k ponderiranje niso verjetnostnih vzorcih.

V our preprost primer glede ocene brezposelnosti v Section 3.4.1, smo razdeljeni populacije, skupinam na podlagi države stalnega prebivališča. V nasprotju s tem, Wang in sodelavci razdeljeno prebivalstvo v v 176,256 skupinah, ki jih določi: spol (2 kategorije), rase (4 kategorije), starost (4 kategorije), izobraževanje (4 kategorije), državo (51 kategorij), ID stranke (3 kategorije), ideologija (3 kategorije) in 2008 glasovanje (3 kategorije). Z več skupin, so raziskovalci upali, da bi bilo bolj verjetno, da je v vsaki skupini odziv nagnjenost nepovezano s podporo za Obamo. Dalje, ne pa gradnji uteži individualni ravni, kot smo to storili v našem primeru, Wang in sodelavci uporabljajo kompleksen model za ocenjevanje deleža ljudi, v vsaki skupini, ki bi glasovali za Obamo. Nazadnje so v kombinaciji teh ocen skupinske podpore z znano velikostjo vsake skupine za izdelavo ocene celotnega raven podpore. Z drugimi besedami, zreže prebivalstva v različne skupine, ocenjuje podporo za Obamo v vsaki skupini, nato pa se je tehtano povprečje ocen skupin, da pripravi celovito oceno.

Tako velik izziv v svojem pristopa je oceniti podporo Obama v vsakem od teh 176,256 skupin. Čeprav je njihova plošča vključena 345,858 edinstvene udeležencev, veliko število s standardi volitev volitev, je bilo veliko, veliko skupin, za katere so imeli Wang in sodelavci skoraj ni anketirancev. Zato je za oceno podpore v vsaki skupini so uporabljali tehniko, imenovano ravneh regresijo s post-stratifikacije, ki raziskovalci ljubkovalno imenujemo gospoda P. V bistvu, oceniti podporo Obama v posebne skupine, gospod P. bazeni informacije od mnogih tesno povezane skupine. Na primer, menijo izziv oceno podpore za Obamo med ženske, Latinoameričanih, starih med 18-29 let, ki so diplomirani, ki so registrirani demokratov, ki sami označujejo umirila, in kdo je glasoval za Obamo v letu 2008. To je zelo zelo specifična skupina in je možno, da nihče v vzorcu s temi značilnostmi. Zato, da ocene o tej skupini, gospod P. bazeni skupaj ocene od ljudi v zelo podobne skupine.

Z uporabo te strategije analize, so bili Wang in sodelavci mogli uporabljati Xbox non-verjetnostnem vzorcu zelo natančno oceniti splošno podporo, da Obama je prejel na volitvah 2012 (slika 3.5). V bistvu so bile njihove ocene bolj natančen kot agregata javnomnenjskih raziskav. Tako je v tem primeru vrednotenje, zlasti gospod P., se zdi, da to dobro delo za popravek pristranskosti v ne-verjetnostno podatkov; pristranskost, ki so vidne, če pogledaš na ocenah podatkov neprilagojenih Xbox.

Slika 3.5: Ocene iz Wang et al. (2015) . Neprilagojena XBox vzorec proizvaja netočne ocene. Ampak, se je tehtana XBox vzorec proizvaja ocene, ki so bile bolj natančno kot v povprečju telefonskih anket, ki temelji na verjetnosti.

Obstajata dve glavni izkušnje iz študiju Wang in sodelavci. Prvič, neprilagojene non-verjetnostni vzorci lahko privede do slabih ocen; To je lekcija, da so številni raziskovalci slišal. Vendar pa je druga lekcija je, da ni verjetnostni vzorci, če so pravilno vrednotena, lahko dejansko proizvajajo zelo dobre ocene. Pravzaprav so njihove ocene natančnejši od ocen iz pollster.com, skupek bolj tradicionalnih volilnih anket.

Končno, obstajajo pomembne omejitve glede tega, kaj se lahko naučimo iz te ene posebne študije. Samo zato, ker post-stratifikacije delal tudi v tem konkretnem primeru, ni nobenega zagotovila, da bo dobro delo tudi v drugih primerih. Dejstvo je, volitve so morda eden izmed najlažjih nastavitvah, saj so raziskovalne agencije študira volitve za skoraj 100 let, je redni povratne informacije (lahko vidimo, kdo zmaga na volitvah) in identifikacijo stranke in demografske značilnosti so relativno napovedno glasovanja. Na tej točki nimamo trdne teorije in empirične izkušnje, da vedo, kdaj bo, mase prilagoditve niso verjetnostnih vzorcih proizvajajo dovolj natančne ocene. Ena stvar, ki je jasno pa je, če ste prisiljeni delati z non-verjetnostnih vzorcih, potem obstaja močan razlog za domnevo, da bodo prilagojene ocene bolje kot niso prilagojeni ocen.