3.4.3 Non-verjetnostni vzorci: vzorec ujemanja

Ta prevod je bil ustvarjen s pomočjo računalnika. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 Non-verjetnostni vzorci: vzorec ujemanja

Ni vse non-verjetnostni vzorci so enaki. Mi lahko dodate več nadzora na sprednjem koncu.

Pristop Wang in sodelavci, ki se uporabljajo za oceno izid ameriških predsedniških volitev 2012 v celoti odvisen od izboljšav v analizi podatkov. To pomeni, da zberejo čim več odgovorov, kot bi lahko, in nato poskušal ponovno uteži njih. V dopolnilni strategije za delo z vzorčenjem brez verjetnosti je, da imajo večji nadzor nad postopkom zbiranja podatkov.

Najenostavnejši primer delno nadzorovanem procesu vzorčenja brez verjetnosti je vzorčenje kvota, tehnika, ki sega v prvih dneh anketnega raziskovanja. Pri vzorčenju kvot, raziskovalci razdeli prebivalstvo v različne skupine (npr mladih moških, mladih žensk, itd) in potem določenih kvot za število ljudi, ki bodo izbrani v vsaki skupini. Anketiranci so izbrani na negotov način, dokler raziskovalec srečal svojo kvoto v vsaki skupini. Zaradi kvot, dobljeni vzorec izgleda bolj kot ciljne populacije, kot bi bilo res drugače, ampak zato, ker so verjetnosti vključitve znano, mnogi raziskovalci so skeptični vzorčenja kvot. V resnici je bilo vzorčenje kvota vzrok za "Dewey Porazi Truman" napaka v 1948 ameriških predsedniških volitev. Saj zagotavlja določeno stopnjo nadzora nad procesom vzorčenja, pa vidimo, kako ima lahko vzorčenje kvota nekaj prednosti v primerjavi s popolnoma nenadzorovano zbiranje podatkov.

Odmik od vzorčenja kvot, bolj sodobni pristopi k nadzorovanju procesa vzorčenja ni verjetnosti, so zdaj mogoče. En tak pristop se imenuje vzorec ujemanja, in je po nekaterih komercialnih ponudnikov spletnih panelov uporablja. V svoji najpreprostejši obliki, vzorec ujemanja zahteva dva vira podatkov: 1) celoten register prebivalstva in 2) veliko ploščo prostovoljcev. Pomembno je, da prostovoljci ni treba verjetnost vzorec iz katerekoli populacije; poudariti, da ne obstajajo zahteve za izbor v panel, ga bom poklical umazana plošča. Prav tako mora biti tudi register prebivalstva in umazana plošča vključuje nekaj dodatnega podatke o vsaki osebi, v tem primeru, bom upoštevati starost in spol, vendar v realnih razmerah bi to pomožni podatki veliko bolj podrobno. Trik ujemanja vzorca je izbrati vzorci iz umazanega sveta na način, ki proizvaja vzorce, ki izgledajo kot verjetnostnih vzorcih.

Vzorec ujemanja se začne, ko je sprejeta simulira verjetnostni vzorec iz registra prebivalstva; ta simulirana vzorec postane ciljni vzorec. Nato, ki temelji na pomožnem informacij primerov v ciljnem vzorcu se ujemajo ljudem v umazano panela, da se tvori ujema vzorec. Na primer, če gre za 25-letni ženski v ciljnem vzorcu, potem raziskovalec najde 25-letni ženski iz umazane plošči, da je v izravnani vzorcu. Na koncu so člani izravnane vzorca anketiranih za izdelavo končnega nabora anketirancev.

Čeprav je uskladiti vzorec izgleda ciljnem vzorcu, je pomembno, da se spomnimo, da se ujema vzorec ni verjetnostni vzorec. Z ujemanjem vzorcev lahko primerja le ciljni vzorec na znane pomožne informacije (na primer, starost in spol), vendar ne na neizmerljive značilnosti. Na primer, če ljudje na umazane plošči ponavadi slabše, konec koncev, eden od razlogov, da se pridružijo raziskavo plošča je zaslužiti denar, potem tudi če se ujema vzorec izgleda ciljnem vzorcu glede na starost in spol, da bo treba še pristranskosti proti revnim ljudem. Čar prave verjetnostnega vzorčenja je izključiti težave na obeh merjenih in neizmerljive značilnosti (na vprašanje, ki je v skladu z našo razpravo ujemanja za vzročno sklepanje iz opazovalnih študij v poglavju 2).

V praksi vzorec ujemanje odvisna ima veliko in raznoliko ploščo si želijo izpolniti ankete, in tako je v glavnem opravljajo podjetja, ki si lahko privoščijo, da razvija in vzdržuje tako ploščo. Tudi v praksi, ne more biti težav z usklajevanjem (včasih dobro tekmo za nekoga v ciljnem vzorcu ne obstaja na plošči) in neodzivnosti (včasih ljudje v izravnani vzorcu zavrne sodelovanje v raziskavi). Zato je v praksi, raziskovalci delajo vzorec ujemanja opravljajo tudi neke vrste prilagoditev post-stratifikacije, da bi ocene.

Težko je zagotoviti uporabne teoretične jamstva glede ujemanja vzorca, v praksi pa lahko dobro opravljajo. Na primer, Stephen Ansolabehere in Brian Schaffner (2014) pošte, telefona in internetne ploščo s pomočjo ujemanja vzorcev in prilagajanje post-stratifikacije: uporabljajo tri različne vzorčenja in razgovor metode primerjali tri vzporedne raziskave o približno 1.000 ljudi, ki se izvajajo v letu 2010. Te ocene od treh pristopov je bila precej podobna ocenah meril visoke kakovosti, kot so raziskava sedanjega prebivalstva (CPS) in National Health Interview Survey (NHIS). Natančneje, sta se obe strani Internet in poštne ankete je začelo v povprečju za 3 odstotne točke in raziskovanju telefon je bil off za 4 odstotne točke. Napake ta veliki približno tisto, kar bi pričakovali od vzorcev okoli 1000 ljudi. Kljub temu, da nobena od teh vrst, proizvedenih bistveno boljši podatki, tako internet in telefon raziskava (ki je dni ali tednov) so bili bistveno hitreje polju kot raziskavo pošte (ki je osem mesecev), in raziskovanju interneta, ki uporabljajo vzorec ujemanja, je bil cenejši od drugih dveh načinih.

Skratka, družboslovci in statistiki so zelo skeptični glede sklepanja iz teh non-verjetnostnih vzorcih, deloma zato, ker so povezani z nekaterimi neprijetno napak anketnega raziskovanja, kot so literarni Digest anketi. Deloma se strinjam s tem skepticizem: neprilagojene non-verjetnostni vzorci so verjetno, da bi slabe ocene. Vendar, če lahko raziskovalci prilagodi pristranskosti v procesu vzorčenja (npr post-stratifikacije) ali nadzor nad postopkom vzorčenja nekoliko (na primer, vzorec ujemanje), ki jih lahko daje boljše ocene in celo ocene dovolj kakovostni za večino namenov. Seveda bi bilo bolje, da ne popolnoma izvršila verjetnostno vzorčenje, vendar to ne zdi več, da je realna možnost.

Oba non-verjetnostni vzorci in verjetnostni vzorci razlikujejo po kakovosti, in zdaj je verjetno res, da je večina ocen iz verjetnostnih vzorcih več zaupanja od ocen iz tretjih verjetnostnih vzorcih. Toda, tudi zdaj, ocene dobro izvedenih non-verjetnostnih vzorcih so verjetno boljši od ocenah slabo izvedenih verjetnostnih vzorcih. Nadalje, non-verjetnostni vzorci so bistveno cenejši. Tako se zdi, da je verjetnost, da v primerjavi z vzorčenjem ne-verjetnostno ponuja stroškovno kakovosten kompromis (slika 3.6). Se že veselim, da bo tudi ocene iz dobro opravljeno brez verjetnostnih vzorcih postala cenejši in boljši. Poleg tega je zaradi okvare v telefonskih anketah daljnovod in povečanjem stopnje neodgovora, pričakujem, da bo verjetnostni vzorci postali dražji in slabše kakovosti. Zaradi teh dolgoročnih trendov, mislim, da bo brez verjetnost vzorčenje vse bolj pomembno v tretjem obdobju anketnega raziskovanja.

Slika 3.6: vzorčenje Verjetnost v praksi in vzorčenje ni verjetnosti sta oba velika, heterogene skupine. Na splošno velja, da je stroškovno napake trade-off z non-verjetnost vzorčenje nižji strošek, ampak večja napaka. Vendar pa se lahko dobro opravljeno, ne verjetnost vzorčenje daje boljše ocene kot slabo opravljeno verjetnostnem vzorčenju. V prihodnosti pričakujem, da bo brez verjetnost vzorčenje bolje in ceneje pa bo verjetnost za vzorčenje slabše in dražje.