3.4.3 Uzorci koji nisu vjerojatnosti: uzorak podudaranja

Nisu svi uzorci nisu vjerojatnosti su isti. Možemo dodati više kontrole na prednjem kraju.

Pristup Wang i suradnici koriste za procjenu ishod američkih predsjedničkih izbora 2012. ovisila isključivo o poboljšanjima u analizi podataka. To jest, oni prikupljaju što više odgovora kao što su mogli, a zatim je pokušao ponovno-weight ih. Komplementarni strategije za rad s uzorkovanjem nisu vjerojatnost da imaju više kontrole nad procesom prikupljanja podataka.

Najjednostavniji primjer je djelomično kontroliranom procesu uzorkovanja ne vjerojatnosti je kvota uzorkovanja, tehnika koja seže do ranih dana anketama. U kvota uzorkovanja, istraživači podijeliti populaciju u različitim skupinama (primjerice, mladi ljudi, mlade žene, itd), a zatim postavite kvote za broj ljudi koji će biti odabran u svakoj grupi. Ispitanici su odabrani na slučajan način sve dok istraživač ispunila svoju kvotu u svakoj grupi. Zbog kvota, dobiveni uzorak izgleda više kao ciljanoj populaciji nego što bi bila istina inače, već zato što su vjerojatnosti inkluzije su nepoznati mnogi istraživači su skeptični kvota uzorkovanja. Naime, kvota uzorkovanja bila je uzrok "Dewey pobijedio Truman" greška u SAD-u predsjedničkim izborima 1948. godine. Jer daje određenu kontrolu nad procesom uzimanja uzoraka, međutim, može se vidjeti kako je kvota za uzorkovanje može imati neke prednosti u odnosu na potpuno nekontroliranog prikupljanja podataka.

Kreće izvan kvota uzorkovanja, moderniji pristupi kontrolu procesa uzorkovanja ne vjerojatnosti su sada moguće. Jedan takav pristup se zove uzorak podudaranja, a ona se koristi od strane nekih komercijalnih online panel usluga. U svom najjednostavnijem obliku, uzorak podudaranja zahtijeva dva izvora podataka: 1) potpuni registar stanovništva i 2) veliku ploču volontera. Važno je da volonteri ne moraju biti uzorak vjerojatnost od bilo koje populacije; naglasiti da ne postoje uvjeti za izbor u ploču, nazvat ću ga prljava ploča. Također, oba registar stanovništva i prljava ploča mora sadržavati neke pomoćne informacije o svakoj osobi, u ovom primjeru, ja ću uzeti u obzir dob i spol, ali u realnim situacijama to pomoćni podaci mogu biti puno detaljnije. Trik uzorka podudaranja je odabrati uzorke od prljave ploče na način da proizvodi uzorke koji izgledaju poput uzoraka vjerojatnosti.

Uzorak podudaranje počinje kada je simuliran uzorak vjerojatnost uzima iz registra stanovništva; to simulirani uzorak postaje meta uzorak. Zatim, na temelju pomoćne informacije slučajeva u ciljnom uzorku se podudaraju s ljudima u prljavu ploču da se formira uskladiti uzorak. Na primjer, ako je 25 godina star ženski u ciljnom uzorku, onda istraživač pronađe 25 godina Ženski od prljave ploče biti u odgovarao uzorku. Na kraju, članovi odgovarao uzorku su intervjuirani za proizvodnju konačni skup ispitanika.

Iako je uskladiti uzorak izgleda kao ciljnom uzorku, važno je zapamtiti da je uskladiti uzorak nije uzorak vjerojatnosti. Podudaranje uzoraka mogu samo odgovara ciljanom uzorak na poznate pomoćne informacije (primjerice, dobi i spola), ali ne i na nemjerljivih karakteristikama. Na primjer, ako ljudi na prljave ploče imaju tendenciju da se siromašnijim-uostalom, jedan od razloga da se pridruže anketa ploča je zaraditi novac-onda čak i ako je uskladiti uzorak izgleda kao ciljnom uzorku s obzirom na dob i spol i dalje će imati pristranost prema siromašnima. Čarolija prave uzorkovanja vjerojatnosti da se isključi problema na obje izmjerenih i nemjerljivih karakteristikama (a što je u skladu s našim rasprave o podudaranje za kauzalne zaključak iz opservacijskih studija u poglavlju 2).

U praksi, uzorak podudaranja ovisi o tome ima veliku i raznoliku ploču željan ispunjavati ankete, i na taj način se uglavnom obavljaju tvrtke koje mogu priuštiti razvijati i održavati takvu ploču. Također, u praksi, tu može biti problema s podudaranja (ponekad dobar izbor za nekoga u ciljnoj uzorku ne postoji na ploči) i ne-odgovora (ponekad ljudi u odgovarao uzorku odbiti sudjelovati u istraživanju). Stoga, u praksi, znanstvenici rade uzorak podudaranja obavljaju i neku vrstu prilagodbe nakon stratifikacije kako bi procjene.

Teško je dati korisne teorijske jamstva o uzorka podudaranja, ali u praksi to može dobro obavljati. Na primjer, Stephen Ansolabehere i Brian Schaffner (2014) usporedili tri paralelna ankete oko 1.000 ljudi provedenih u 2010. godini pomoću tri različite uzorkovanje i intervjuiranje metode: mail, telefon i internet ploču pomoću uzorka odgovara i podešavanje post-slojevitost. Procjene iz tri pristupa bili su vrlo slični procjenama iz kvalitetnih mjerila, kao što je Current Population Survey (CPS) i National Health Interview Survey (neljudskih entiteta). Točnije, internet i mail ankete su off u prosjeku za 3 postotna boda, a telefon Istraživanje je off za 4 postotna boda. Pogreške ovaj veliki su otprilike ono što se moglo očekivati ​​od uzoraka oko 1.000 ljudi. Iako niti jedan od tih načina proizvedenih znatno bolji podaci, internet i telefon anketa (koja je nekoliko dana ili tjedana) bili su znatno brže području od ankete pošte (koja je trajala osam mjeseci), a internet ankete, koja se koristi uzorak podudaranja, bio je jeftiniji od druga dva načina.

U zaključku, društveni znanstvenici i statističari su nevjerojatno skeptični zaključaka iz tih uzoraka ne vjerojatnosti, dijelom jer su povezani s nekim neugodnim propustima anketama kao što su Književna Digest anketi. U drugom dijelu, slažem se s ovim skepticizma: neprilagođene uzorci nisu vjerojatnosti vjerojatno će se proizvoditi loše procjene. Međutim, ako istraživači mogu prilagoditi za predrasude u procesu uzorkovanja (npr nakon stratifikacije) ili kontrolirati proces uzorkovanja nešto (npr uzorak podudaranje), oni mogu proizvesti bolje procjene, pa čak i procjene dovoljne kvalitete za većinu svrhe. Naravno, bilo bi bolje da to savršeno izvršiti uzorkovanje vjerojatnosti, ali to više ne čini se da je realna opcija.

Uzorci koji nisu vjerojatnost i uzorci vjerojatnost razlikuju po svojoj kvaliteti, a trenutno je vjerojatno slučaj da većina procjena iz uzoraka vjerojatnosti su više povjerenja nego procjenama iz uzorka koji nisu vjerojatnosti. No, čak i sada, prema procjenama, iz dobro provedenih uzoraka koji nisu vjerojatnosti su vjerojatno bolji od procjene iz loše provedenih uzoraka vjerojatnosti. Nadalje, uzorci nisu vjerojatnosti su znatno jeftiniji. Dakle, čini se da je vjerojatnost vs uzorkovanja ne vjerojatnosti nudi troškova kvalitete trade-off (Slika 3.6). Gledajući naprijed, očekujem da su procjene iz dobro učinio uzoraka koji nisu vjerojatnosti će postati jeftinije i bolje. Nadalje, zbog kvara na fiksne telefonske ankete i povećanje stope ne-odgovor, očekujem da će se uzorci vjerojatnost postati skuplji i slabije kvalitete. Zbog ovih dugoročnih trendova, mislim da se uzorkovanje ne vjerojatnosti će postati sve značajniji u trećoj eri anketama.

Slika 3.6: Vjerojatnost uzorkovanje u praksi i uzorkovanja ne vjerojatnosti su i velike, heterogene kategorije. U principu, tu je cijena pogreške trade-off s uzorkovanja nisu vjerojatnost bude niža cijena, ali veća je greška. No, dobro učinio uzorkovanja ne vjerojatnosti može proizvesti bolje procjene nego loše obavljen uzorkovanja vjerojatnosti. U budućnosti, očekujem da se uzorkovanje ne vjerojatnost će biti bolje i jeftinije, a uzorkovanje je vjerojatnost će se pogoršati i skuplje.

Slika 3.6: Vjerojatnost uzorkovanje u praksi i uzorkovanja ne vjerojatnosti su i velike, heterogene kategorije. U principu, tu je cijena pogreške trade-off s uzorkovanja nisu vjerojatnost bude niža cijena, ali veća je greška. No, dobro učinio uzorkovanja ne vjerojatnosti može proizvesti bolje procjene nego loše obavljen uzorkovanja vjerojatnosti. U budućnosti, očekujem da se uzorkovanje ne vjerojatnost će biti bolje i jeftinije, a uzorkovanje je vjerojatnost će se pogoršati i skuplje.