3.4.3 Uzorci Non-verovatnoća: uzorak podudaranje

Nisu svi uzorci nisu verovatnoća su isti. Možemo dodati više kontrole na prednjem kraju.

Pristup Wang i kolege koriste za procjenu ishod američkih predsjedničkih izbora 2012 zavisio isključivo na poboljšanja u analizi podataka. To jest, oni prikupili što više odgovora kao što su mogli, a zatim pokušao da ih ponovo težinu. A komplementarne strategije za rad sa ne-verovatnoća uzorkovanje je da imaju više kontrole nad procesom prikupljanja podataka.

Najjednostavniji primjer djelimično kontrolisan proces uzorkovanja ne verovatnoća je kvota uzorkovanja, tehniku ​​koja seže u ranim danima istraživanju. U kvota uzorkovanja, istraživači podjele populacije u različite grupe (npr, mladići, djevojke, itd), a zatim set kvote za broj ljudi da bude izabran u svakoj grupi. Ispitanici su odabrani na slučajan način dok istraživač ispunila svoju kvotu u svakoj grupi. Zbog kvota, rezultirajući uzorak izgleda više kao ciljne populacije nego što bi bilo istinito inače, već zato što je verovatnoća inkluzije su nepoznati mnogi istraživači su skeptični kvota uzorkovanja. U stvari, kvota uzorkovanja je bio uzrok "Dewey Defeats Truman" greška u 1948. SAD predsjedničkih izbora. Jer pruža određenu kontrolu nad procesom uzimanja uzoraka, međutim, može se vidjeti kako se kvota uzorkovanja možda ima neke prednosti u odnosu na potpuno nekontrolisano prikupljanje podataka.

Moving izvan kvote uzorkovanje, modernijeg pristupa kontrolisanje procesa uzorkovanja ne vjerovatnoća su sada moguće. Jedan takav pristup se zove uzorak podudaranje, a ona se koristi od strane nekih komercijalnih provajdera online panel. U svom najjednostavnijem obliku, uzorak podudaranje zahtijeva dva izvora podataka: 1) potpuni registar stanovništva i 2) veliki panel volontera. Važno je da volonteri ne treba biti uzorak vjerojatnost od bilo koje populacije; naglasiti da ne postoje uslovi za izbor u panel, ja ću ga nazvati prljava panel. Također, oba registra stanovništva i prljave panel mora uključivati ​​neke pomoćne informacije o svakoj osobi, u ovom primjeru, ja ću uzeti u obzir dob i spol, ali u realnim situacijama ove pomoćne informacije mogle biti mnogo detaljnije. Trik uzorka podudaranje je da izaberete uzorke iz prljave panela na način koji stvara uzorke koji izgledaju kao uzorci verovatnoća.

Uzorak podudaranje počinje kada je simuliran uzorak vjerojatnost uzima iz registra stanovništva; ovo simulirani uzorak postaje meta uzorak. Onda, na osnovu pomoćne informacije, slučajevi u ciljnom uzorku se podudaraju sa ljudima u prljavu panelu da se formira podudaraju uzorak. Na primjer, ako postoji 25 godina star u ciljnom uzorku, onda istraživač nađe 25 godina Značke iz prljave panela da se u usklađenom uzorku. Na kraju, članovi usklađenih uzorka su razgovarali da proizvede konačni skup ispitanika.

Iako je uskladiti uzorak izgleda kao ciljni uzorak, važno je imati na umu da je uskladiti uzorak nije uzorak vjerojatnost. Usklađena uzoraka može mjeriti samo ciljnom uzorku na poznate pomoćnih informacija (npr, dobi i spolu), ali ne i na nemereni karakteristikama. Na primjer, ako ljudi na prljave panelu su siromašnija-uostalom, jedan od razloga da se pridruže panel istraživanja je da zaradi novac-onda čak i ako se poklapaju uzorak izgleda kao ciljni uzorak u pogledu dobi i spolu i dalje će imati predrasude prema siromašnim ljudima. Magija istina vjerovatnoća uzorkovanja je da vlada na probleme i na mjeriti i nemereni karakteristike (tačka koja je u skladu s našim diskusiju odgovaraju za kauzalne zaključak iz opservacijskih studija u poglavlju 2).

U praksi, uzorak podudaranje zavisi ima veliku i raznoliku panel žele da završe istraživanja, a time i to je uglavnom rade kompanije koje mogu priuštiti da razvija i održava takav panel. Također, u praksi, ne može biti problema sa podudaranje (ponekad dobar meč za nekoga u ciljnom uzorku ne postoji na panelu) i ne-odgovor (ponekad ljudi u usklađenom uzorku odbijaju da učestvuju u anketi). Stoga, u praksi, istraživači rade uzorak podudaranje obavljati neku vrstu prilagodbe post-stratifikacije da procjene.

Teško je dati korisne teorijske garancije o uzorak podudaranje, ali u praksi se može dobro obavljati. Na primjer, Stephen Ansolabehere i Brian Schaffner (2014) u odnosu tri paralelna istraživanja oko 1.000 ljudi iz 2010. godine koristeći tri različita uzorkovanja i metode intervjua: mail, telefon i internet panel pomoću uzorka usklađivanje i prilagođavanje nakon stratifikacije. Procjene iz tri pristupa bili su prilično slični procjenama od visoko-kvalitetne standarde, kao što su ankete sadašnje populacije (CPS) i Nacionalne zdravstvene Intervju Anketa (NHIS). Konkretnije, oba istraživanja Interneta i e-mail su van u prosjeku za 3 procentna poena i ankete telefon bio isključen za 4 procentna poena. Greške ovaj veliki su otprilike ono što može očekivati ​​od uzoraka od oko 1.000 ljudi. Iako nijedna od ovih načina proizvodi znatno bolje podatke, kako ankete internet i telefon (koji je dana ili tjedna) bili su znatno brže polje od ankete mail (koji je osam mjeseci), i internet ankete, koja se koristi uzorak podudaranje, bio je jeftiniji od druga dva režima.

U zaključku, sociolozi i statističari su izuzetno skeptični zaključaka iz tih uzoraka ne verovatnoća, dijelom zbog toga što su povezane sa nekim neugodno neuspjeha anketnog istraživanja, kao što su književne Digest anketi. U dijelu, ja se slažem sa ovom skepticizam: neprilagođena uzorci nisu verovatnoća vjerovatno će proizvesti loše procjene. Međutim, ako se istraživači mogu prilagoditi za predrasude u procesu uzorkovanja (npr, nakon stratifikacije) ili kontrolirati proces uzorkovanja nešto (npr uzorak podudaranje), oni mogu proizvesti bolje procjene, pa čak i procjene dovoljno kvalitete za većinu svrhe. Naravno, bilo bi bolje da to savršeno izvršava vjerojatnost uzorkovanja, ali to više ne izgleda da je realna opcija.

Oba uzorka ne verovatnoća i uzoraka verovatnoća variraju u svojoj kvaliteti, a trenutno je vjerojatno slučaj da većina procjene iz uzoraka verovatnoća su pouzdaniji od procjene iz uzorka ne verovatnoća. Ali, čak i sada, procjene iz dobro vodi uzorci nisu verovatnoća su vjerojatno bolji od procjene iz loše vodi uzoraka verovatnoća. Nadalje, uzorci nisu verovatnoća su znatno jeftiniji. Stoga, čini se da je vjerojatnost vs non-vjerojatnost uzorkovanje nudi troškova kvalitete trade-off (Slika 3.6). Gledajući u budućnost, očekujem da procjene iz dobro urađeno uzorci nisu verovatnoća će pojeftiniti i bolje. Nadalje, zbog kvara u telefonskim anketama fiksne i povećanje stope bez odgovora, očekujem da će uzorke verovatnoća postati skuplji i lošijeg kvaliteta. Zbog ovih dugoročnih trendova, mislim da će ne-vjerojatnost uzorkovanja postaju sve važniji u trećoj eri istraživanju.

Slika 3.6: Vjerojatnost uzorkovanje u praksi i ne-vjerovatnoća uzorkovanja su i velike, heterogene kategorije. U principu, tu je trošak greške trade-off s non-vjerojatnost uzorkovanje što nižoj cijeni, ali veća greška. Međutim, dobro urađeno ne vjerojatnost uzorkovanja može proizvesti bolje procjene nego loše učinio vjerojatnost uzorkovanja. U budućnosti, očekujem da će non-vjerojatnost uzorkovanje bolje i jeftinije, a vjerojatnost uzorkovanje će se pogoršati i skuplje.

Slika 3.6: Vjerojatnost uzorkovanje u praksi i ne-vjerovatnoća uzorkovanja su i velike, heterogene kategorije. U principu, tu je trošak greške trade-off s non-vjerojatnost uzorkovanje što nižoj cijeni, ali veća greška. Međutim, dobro urađeno ne vjerojatnost uzorkovanja može proizvesti bolje procjene nego loše učinio vjerojatnost uzorkovanja. U budućnosti, očekujem da će non-vjerojatnost uzorkovanje bolje i jeftinije, a vjerojatnost uzorkovanje će se pogoršati i skuplje.