3.4.2 Uzorci Non-verovatnoća: ponderisanja

S uzorcima ne verovatnoća, težine može poništiti izobličenja uzrokovana pretpostavlja proces uzorkovanja.

Na isti način na koji istraživači težine odgovora iz uzoraka vjerojatnost, oni mogu težine odgovora iz uzoraka ne verovatnoća. Na primjer, kao alternativa za CPS, zamislite da ste postavili banner oglase na tisuće web stranica za zapošljavanje učesnika ankete za procjenu stope nezaposlenosti. Naravno, ti bi bio skeptičan da je jednostavno sredstvo vašeg uzorka bi bilo dobro procjena stope nezaposlenosti. Vaš skepticizam je vjerojatno zato što mislite da neki ljudi imaju veće šanse da završi svoj ankete od drugih. Na primjer, ljudi koji ne provode puno vremena na webu su manje šanse da završe svoj anketu.

Kao što smo vidjeli u posljednjem poglavlju, međutim, ako znamo kako je izabran-kao uzorak radimo sa vjerojatnost uzorcima-onda možemo poništiti distorzije uzrokovane proces uzorkovanja. Nažalost, kada se radi s uzorcima koji nisu verovatnoća, mi ne znamo kako je odabran uzorak. Ali, možemo napraviti pretpostavke o procesu uzorkovanja, a zatim primijeniti ponder na isti način. Ako su ove pretpostavke ispravne, onda pondera će poništiti distorzije uzrokovane proces uzorkovanja.

Na primjer, zamislite da u odgovoru na vaše banner oglase, te je regrutovao 100.000 ispitanika. Međutim, ne vjerujem da su ovi 100.000 ispitanici su jednostavni slučajni uzorak odraslih Amerikanaca. U stvari, kada se uporede svoj ispitanika u SAD stanovništva, naći da su ljudi iz neke države (npr, New York) preko zastupljeni i da su ljudi iz neke države (npr, Aljaska) su nedovoljno zastupljene. Tako je stopa nezaposlenosti vašeg uzorka će vjerovatno biti loša procjena stope nezaposlenosti u ciljnoj populaciji.

Jedan od načina da poništi distorziju koja se dogodila u procesu uzorkovanja je dodijeliti težine u svakoj osobi; niže težine ljudima iz država koje su više zastupljeni u uzorku (npr, New York) i veće težine ljudima iz država koje su nedovoljno zastupljene u uzorku (npr, Aljaska). Konkretnije, težine za svakog ispitanika se odnosi na njihove prevalencije u uzorku u odnosu na njihove prevalencije u SAD-u populaciji. Ovaj postupak ponderisanje se zove post-stratifikacije, a ideja vaganja treba vas podsjetiti na primjer u točki 3.4.1, gdje su dobili ispitanici iz Rhode Island manje težine nego ispitanici iz Kalifornije. Post-stratifikacija zahtijeva da znate dovoljno da stavi svoj ispitanika u grupe i da znaju udio ciljne populacije u svakoj grupi.

Iako je ponder uzorka vjerovatnoće i uzorka ne verovatnoća su isti matematički (vidi tehničke dodatak), oni dobro rade u različitim situacijama. Ako istraživač ima savršen uzorak vjerojatnost (tj, ne pokriva greške i ne bez odgovora), a zatim ponderisanje će proizvoditi nepristrasno procjene za sve osobine u svim slučajevima. Ovaj snažan teorijski garancija je zašto zastupnici uzoraka vjerojatnost da ih nađem tako privlačna. S druge strane, ponderisanje uzorci nisu verovatnoća će samo proizvoditi nepristrasno procjene za sve osobine ako su sklonosti odgovor su isti za sve u svakoj grupi. Drugim riječima, misleći natrag u našem primjeru, koristeći post-stratifikacije će proizvoditi nepristrasno procjene ako svi u New Yorku ima istu vjerojatnost učestvuju i svi na Aljasci ima istu vjerojatnost da učestvuju i tako dalje. Ova pretpostavka se zove homogena-odgovor-sklonosti-u-grupa pretpostavka, a igra ključnu ulogu u znajući da li će nakon stratifikacije dobro raditi s uzorcima koji nisu verovatnoća.

Na žalost, u našem primjeru, pretpostavka homogena-odgovor-sklonosti-u-grupa čini malo vjerovatno da bi bilo istinito. To jest, malo je verovatno da su svi na Aljasci ima istu vjerojatnost da bude u vašem istraživanju. Ali, postoje tri važna boda na umu o post-stratifikaciju, a sve bi izgledalo više obećava.

Prvo, homogena-odgovor-sklonosti-u-grupa pretpostavka postaje uvjerljivo kao broj grupa povećava. I, istraživači nisu ograničeni na grupe samo na osnovu jedne geografske dimenziju. Na primjer, mogli bismo stvoriti grupe na osnovu države, starost, pol, i nivo obrazovanja. Čini se više moguće da postoji homogena sklonosti odgovor u grupi 18-29, ženski, koledž diplomanata koji žive na Aljasci nego u grupi od svih ljudi koji žive na Aljasci. Dakle, što je broj grupa koristi za post-stratifikaciju povećava, pretpostavke potrebne za podršku je postalo više razumno. S obzirom na tu činjenicu, čini se da bi istraživači želite stvoriti veliki broj grupa za post-stratifikacije. Ali, kako se broj grupa povećava, istraživači rade na drugačiji problem: sparsity podataka. Ako postoji samo mali broj ljudi u svakoj grupi, onda procjene će biti neizvjesna, a na krajnjem slučaju kada postoji grupa koja nema ispitanika, a zatim nakon stratifikacije potpuno pokvari. Postoje dva načina iz ove inherentne tenzije između uvjerljivost homogeneous- odgovor-sklonost-u-grupa pretpostavka i potražnja za razumne veličine uzorka u svakoj grupi. Jedan od pristupa je da se presele u sofisticiraniji statistički model za izračunavanje težine, a drugi je da se prikupe veći, raznovrsniji uzorak, koji pomaže da se osigura razumno veličine uzorka u svakoj grupi. I, ponekad istraživači oboje, kao što ću opisati u više detalja ispod.

Drugi obzir kada se radi sa post-stratifikacije iz uzoraka ne verovatnoća je da je pretpostavka homogena-odgovor-sklonost-u-grupa je već često se prilikom analize uzoraka vjerojatnost. Razlog zbog kojeg je potrebna ova pretpostavka za uzorke verovatnoća u praksi je da su uzorci verovatnoća imaju neodaziva, a najčešći način za podešavanje za ne-odgovor je post-stratifikacije kao što je opisano gore. Naravno, samo zbog toga što mnogi istraživači napraviti određene pretpostavke ne znači da biste trebali učiniti isto. Ali, to ne znači da kada se uspoređuju uzorci nisu vjerojatnost da uzoraka verovatnoća u praksi, moramo imati na umu da su i ovise o pretpostavkama i pomoćne informacije, kako bi se proizvoditi procjene. U većini realne postavke, jednostavno nema pristup pretpostavka bez da zaključak.

Na kraju, ako ti je stalo jednoj procjeni posebno u našem primjeru stopa nezaposlenosti-onda vam je potreban uslov slabiji nego homogena-odgovor-sklonost-u-grupa pretpostavka. Naime, ne treba pretpostaviti da svako ima istu sklonost odgovor, potrebno je samo da pretpostavimo da ne postoji povezanost između sklonosti odgovor i stopa nezaposlenosti unutar svake grupe. Naravno, čak i ovaj slabiji stanje neće držati u nekim situacijama. Na primjer, zamislite procjeni udio Amerikanaca koji rade volonterski rad. Ako ljudi koji rade volonterski rad češće da se dogovore da se u istraživanju, onda istraživači će sistematski preko-procijeniti iznos volontiranja, čak i ako oni rade korekcije nakon stratifikacije, rezultat koji je empirijski pokazuje Abraham, Helms, and Presser (2009) .

Kao što sam ranije rekao, uzorci ne verovatnoća se gleda sa velikim skepticizmom prema društvenih nauka, dijelom zbog njihove uloge u nekim od najvećih sramota propusta u ranim danima istraživanju. Jasan primjer kako daleko smo došli s uzorcima koji nisu verovatnoća je istraživanje Wei Wang, David Rothschild, Sharad Goel, a Andrew Gelman da pravilno oporavio na ishod američkih izbora 2012 pomoću ne-verovatnoća uzorku od korisnika American Xbox -a odlučno ne slučajnom uzorku od Amerikanaca (Wang et al. 2015) . Istraživači regrutirao ispitanika iz gaming sistem Xbox, a kao što ste mogli očekivati, Xbox uzorak iskrivljen muškog i iskrivljen mladi: 18 - 29 godina starosti čine 19% biračkog tijela, ali 65% od Xbox uzorka i muškarci čine 47% biračkog tijela i 93% od Xbox uzorka (Slika 3.4). Zbog ovih snažne demografske predrasude, sirovi Xbox podataka je loš pokazatelj izbora povratka. To predviđa snažan pobjeda za Mitt Romney više od Baracka Obame. Opet, ovo je još jedan primjer opasnosti od sirovog, neprilagođena uzorci nisu verovatnoća i podsjeća na književne Digest fijasko.

Slika 3.4: Demografija ispitanika u Wang et al. (2015.). Zato što su ispitanici regrutirao iz Xbox, oni su češće biti mlad i veće šanse da bude muško, u odnosu na biračima na izborima 2012. godine.

Slika 3.4: Demografija ispitanika u Wang et al. (2015) . Zato što su ispitanici regrutirao iz Xbox, oni su češće biti mlad i veće šanse da bude muško, u odnosu na biračima na izborima 2012. godine.

Međutim, Wang i njegove kolege su bili svjesni tih problema i pokušali da težinu ispitanika da ispravi za proces uzorkovanja. Konkretno, oni koristili sofisticiraniji oblik post-stratifikacije sam ti pričao. Važno je učenje nešto više o svom pristupu jer se gradi intuicije o post-stratifikacije, a posebno verzija Wang i kolege koristi je jedan od najuzbudljivijih pristupa ponderisanja uzorci nisu verovatnoća.

U našem jednostavnom primjeru o procjeni nezaposlenosti u točki 3.4.1, podijeljeni smo stanovništva u grupe na osnovu stanja prebivališta. Nasuprot tome, Wang i kolege podijelili stanovništvo u u 176.256 grupe definiše: pol (2 kategorije), utrka (4 kategorije), dob (4 kategorije), obrazovanje (4 kategorije), država (51 kategorija), stranka ID (3 kategorija), ideologija (3 kategorije) i 2008. godine glasova (3 kategorije). Sa više grupa, istraživači su se nadali da bi bilo sve vjerovatnije da unutar svake grupe, sklonost odgovor je bio korelaciji sa podrškom za Obamu. Zatim, umjesto da gradi težine pojedinačnih nivou, kao što smo učinili u našem primjeru, Wang i kolege koriste kompleksan model za procjenu procenat ljudi u svakoj grupi koja će glasati za Obamu. Na kraju, oni u kombinaciji ove procjene grupa podrške sa poznatim veličine svake grupe da proizvede procijenjene ukupan nivo podrške. Drugim riječima, oni sjeckani se stanovništvo u različite grupe, procjenjuje se podrška za Obamu u svakoj grupi, a zatim je ponderirani prosjek procjena grupe u izradi ukupnog procjena.

Tako je veliki izazov u njihovom pristupu je procijeniti podrška za Obamu u svakoj od tih 176.256 grupe. Iako je njihov panel uključeno 345.858 jedinstvenih učesnika, ogroman broj po standardima izbora biračkih, bilo je mnogo, mnogo grupa za koje Wang i kolege imali gotovo nikakav ispitanika. Dakle, za procjenu podrške u svakoj grupi su koristili tehniku ​​koja se zove razina regresije sa post-stratifikacije, koji istraživači milošte zovu gospodin P. U suštini, za procjenu podrške za Obamu u okviru određene grupe, gospodin P. bazeni informacije iz mnogih usko povezane grupe. Na primjer, razmotrimo izazov procjene podrške za Obamu među ženama, Latinoamerikanci, između starih 18-29 godina, koji su koledž diplomci, koji su registrirani demokrati, koji sebe identifikuju kao umjerenjaka, i koji su glasali za Obamu u 2008. godine je vrlo, vrlo specifične grupe, a moguće je da nema nikoga u uzorku sa ovim karakteristikama. Stoga, kako bi procjene o ovoj grupi, gospodin P. bazena zajedno procjenjuje od ljudi u vrlo sličnim grupama.

Koristeći ove strategije analize, Wang i kolege su bili u mogućnosti koristiti XBox ne verovatnoća uzorak vrlo pažljivo procijeniti ukupnu podršku da je Obama dobio na izborima 2012. godine (Slika 3.5). U stvari, njihove procjene bile preciznije nego agregat istraživanja javnog mnjenja. Tako je, u ovom slučaju, ponderisanje-konkretno gospodin P.-izgleda napraviti dobar posao ispravljanja predrasude u ne-vjerojatnost podataka; predrasude koje su vidljive kada pogledate na procjene iz neusklađenih podataka Xbox.

Slika 3.5: Procjene iz Wang et al. (2015.). Neprilagođene XBox uzorak proizveden netačne procjene. No, ponderirana XBox uzorak proizveden procjenama koje su bile preciznije nego u prosjeku telefonske ankete vjerovatnoće na bazi.

Slika 3.5: Procjene iz Wang et al. (2015) . Neprilagođene XBox uzorak proizveden netačne procjene. No, ponderirana XBox uzorak proizveden procjenama koje su bile preciznije nego u prosjeku telefonske ankete vjerovatnoće na bazi.

Postoje dvije glavne pouke iz studije Wang i kolege. Prvo, neprilagođene uzorci nisu verovatnoća može dovesti do loše procjene; ovo je lekcija koju mnogi istraživači su čuli. Međutim, druga lekcija je da uzorci ne verovatnoća, kada weighted ispravno, zapravo može proizvesti prilično dobro procjene. U stvari, njihove procjene bile preciznije od procjene iz pollster.com, kao agregacije više tradicionalnog izbora anketama.

Na kraju, postoje značajne ograničenja na ono što možemo naučiti iz ove jedne specifične studije. Samo zato što post-stratifikacije dobro radila u ovom konkretnom slučaju, ne postoji garancija da će dobro raditi u drugim slučajevima. U stvari, izbori su možda jedan od najlakših postavki jer anketari su proučavali izbore za skoro 100 godina, ima redovne povratne informacije (vidimo ko će pobijediti na izborima), i identifikaciju stranke i demografske karakteristike su relativno prediktivni glasanja. U ovom trenutku, nemamo čvrstih teorije i empirijskog iskustva da znam kada težine prilagođavanje uzorci nisu verovatnoća će proizvesti dovoljno precizne procjene. Jedna stvar koja je jasna, međutim, ako ste prisiljeni da rade s uzorcima koji nisu verovatnoća, onda postoji jak razlog da se vjeruje da će prilagođeni procjenama biti bolje od ne-prilagođene procjene.