3.4.3 Vzorky Non-pravdepodobnostné: vzorka zodpovedajúca

Tento preklad bol vytvorený na počítači. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 Vzorky Non-pravdepodobnostné: vzorka zodpovedajúca

Nie všetky vzorky non-pravdepodobnostné sú rovnaké. Môžeme pridať väčšiu kontrolu na prednej strane.

Prístup Wang a jeho kolegovia používajú odhadnúť výsledok v roku 2012 amerických prezidentských volieb závisel výhradne na zlepšenie v analýze dát. To znamená, že zhromaždené toľko odpovedí, ako len mohli, a potom sa pokúsil re-váha je. Doplnkovou stratégiu pre prácu s odberom vzoriek non-pravdepodobnostné je mať väčšiu kontrolu nad procesom zberu dát.

Najjednoduchším príkladom čiastočne riadeného procesu vzorkovania non-pravdepodobnostné vzorkovanie je kvóta, technika, ktorá siaha až do prvých dní výskumného šetrenia. Pri odbere kvót, výskumníci rozdeliť populáciu do rôznych skupín (napríklad mladí muži, mladé ženy, atď) a potom nastaviť kvóty pre počet osôb, ktoré majú byť vybrané v každej skupine. Respondenti sú vyberané náhodne, kým sa výskumný pracovník nesplní svoju kvótu v každej skupine. Vzhľadom k tomu, kvót, výsledný vzorka vyzerá skôr ako cieľovej populácie, než by bolo inak true, ale preto, pravdepodobnosti zahrnutie nie sú známe mnohí bádatelia sú skeptickí odberu vzoriek kvóty. V skutočnosti, vzorkovanie kvóta bola príčinou "Dewey porazí Trumana" Chyba v 1948 amerických prezidentských voľbách. Vzhľadom na to, že poskytuje určitú kontrolu nad procesu vzorkovania, však, je vidieť, ako odber kvóta môže mať niektoré výhody v priebehu zberu dát úplne nekontrolované.

Pohybujúce sa nad rámec odberu vzoriek kvót, ďalšie moderné prístupy k riadeniu procesu vzorkovania non-pravdepodobnostné sú teraz možné. Jeden takýto prístup sa nazýva vzorka vyhovujúce, a je používaný niektorými komerčných poskytovateľov on-line panelu. Vo svojej najjednoduchšej podobe vzorka zodpovedajúce vyžaduje dva zdroje dát: 1) kompletné evidenciu obyvateľov a 2) veľký panel dobrovoľníkov. Je dôležité, že dobrovoľníci nemusí byť vzorka pravdepodobnosť z akejkoľvek populácie; zdôrazniť, že neexistujú žiadne požiadavky pre výber do panelu, zavolám to špinavá panel. Tiež, ako register obyvateľov a špinavá panel musí obsahovať nejaké pomocné údaje o každej osobe, v tomto prípade budem uvažovať o vek a pohlavie, ale v reálnych situáciách táto pomocná informácia by mohli byť oveľa podrobnejšie. Trik zhoda vzorky je výber vzoriek z špinavé panela takým spôsobom, ktorý produkuje vzorky, ktoré vyzerajú ako pravdepodobnostných výberov.

Vzorka zodpovedajúce začína, keď je simulovaný vzorka pravdepodobnosť prevzatý z registra obyvateľov; Tento simulované vzorka sa stáva terčom vzorka. Potom, na základe pomocné informácie prípadov v cieľovom vzorky sú prispôsobené pre ľudí v špinavej panelu pre vytvorenie prispôsobeného vzorky. Napríklad, ak tam je 25 ročná žena v cieľovom vzorke, potom výskumník nájde 25 rokov Žena z špinavé panelu byť v krytej vzorke. Nakoniec členovia krytej vzorky sú pýtali vyrábať konečnú sadu respondentov.

Aj keď je uzavreté vzorka vyzerá ako cieľového vzorky, je dôležité mať na pamäti, že uzavreté vzorka nie je vzorka pravdepodobnosť. Párované vzorky môžu odpovedať iba cieľový vzorku na známu pomocnú informácií (napríklad vek a pohlavie), ale nie na nemeraných charakteristík. Napríklad, ak ľudia na špinavé paneli bývajú chudobnejší konieckoncov, jeden z dôvodov, spojiť prieskum panel je zarábať peniaze, potom aj keď je uzavreté vzorky bude vyzerať cieľovej vzorke z hľadiska veku a pohlavia bude stále mať zaujatosť voči chudobným ľuďom. Kúzlo pravého náhodnom výbere je vylúčiť problémov na oboch meraných aj nemeraných vlastnosťami (bod, ktorý je v súlade s našou diskusiu o zodpovedajúce za príčinnej záver z pozorovacích štúdií v kapitole 2).

V praxi sa vzorka zodpovedajúca závisí na tom, že má veľký a rôznorodý panel dychtivý o vyplnenie dotazníka, a preto sa vykonáva hlavne firmy, ktoré si môžu dovoliť rozvíjať a udržiavať taký panel. Tiež v praxi, tam môže byť problémy s zodpovedajúce (niekedy dobrý zápas pre niekoho v cieľovom vzorky neexistuje na paneli) a non-response (niekedy ľudia v krytej vzorke odmietnuť účasť v prieskume). Preto sa v praxi výskumníci robia v rovnakom vzorke tiež vykonať nejaké úpravy post-stratifikácie, aby odhady.

Je ťažké poskytnúť užitočné teoretické záruky o vyrovnanie vzorky, ale v praxi to môže fungovať dobre. Napríklad Stephen Ansolabehere a Brian Schaffner (2014) v porovnaní tri paralelné prieskumy asi 1000 ľudí vykonaných v roku 2010 s použitím troch rôznych vzorkovania a interview metódy: mail, telefón a internetový panel s použitím vzorky vecné a nastavenie post-stratifikácie. Odhady z troch prístupov boli dosť podobné odhadov z vysoko kvalitných merítok ako je aktuálna populačného prieskumu (CPS) a National Health Interview Survey (NZIS). Presnejšie povedané, obaja prieskumy internet a poštové boli preč v priemere o 3 percentuálne body a prieskum telefón bol vypnutý o 4 percentuálne body. Chyby toto veľké sú zhruba to, čo by sa dalo očakávať zo vzoriek asi 1000 ľudí. Hoci žiadna z týchto režimov vyrobených podstatne lepšie dáta, ako internet a telefónne prieskum (čo trvalo dni alebo týždne), boli podstatne rýchlejší pole než poštové prieskumu (čo trvalo osem mesiacov), a prieskum internetu, ktorý používal v rovnakom vzorke, bol lacnejší než ostatné dva režimy.

Záverom možno povedať, sociológovia a štatistici sú neuveriteľne skeptický ohľadom záverov z týchto vzoriek non-pravdepodobnosti, z časti preto, že sú spojené s niektorými trápne zlyhanie výskumného šetrenia ako je Literárne Digest hlasovanie. Sčasti súhlasím s týmto skepticky: neupravenej vzorky non-pravdepodobnostné budú pravdepodobne produkovať zlé odhady. Avšak, ak výskumníci možno nastaviť pre vychýlenie v procese vzorkovania (napríklad post-stratifikácia), alebo riadiť proces vzorkovania trochu (napr vzorka zodpovedajúca), môžu dosiahnuť lepšie odhadov a dokonca aj odhady dostatočne kvalitné pre väčšinu účelov. Samozrejme, že by bolo lepšie urobiť dokonale vykonaný odber vzoriek pravdepodobnosti, ale to už sa zdá byť reálnou možnosťou.

Obe vzorky non-pravdepodobnostné a vzorky pravdepodobnosť líšia v ich kvalite, a v súčasnej dobe je pravdepodobné, že v prípade, že väčšina odhadov z pravdepodobnostných výberov sú dôveryhodnejšie než odhady zo vzoriek non-pravdepodobnosti. Ale aj teraz, odhady dobre vykonaných vzoriek non-pravdepodobnostných sú pravdepodobne lepšie ako odhady zo zle vykonaných pravdepodobnostných výberov. Ďalej, vzorky non-pravdepodobnostné sú podstatne lacnejšie. Tak sa zdá, že pravdepodobnosť vs vzorkovanie non-pravdepodobnostné ponúka cenovo kvalitné trade-off (obrázok 3.6). Pri pohľade do budúcnosti očakávam, že odhady dobre vykonaných vzoriek non-pravdepodobnosťou bude lacnejšie a lepšie. Ďalej, pretože zrútenie pevné telefónne prieskumy a narastajúcim výskytom non-response, predpokladám, že vzorky pravdepodobnosťou bude drahšie a menej kvalitné. Vzhľadom na tieto dlhodobých trendov, myslím, že výber vzorky non-pravdepodobnosti stane v tretej dobe výskumného šetrenia čoraz dôležitejšie.

Obrázok 3.6: vzorkovanie Pravdepodobnosť v praxi a odber vzoriek non-pravdepodobnostné sú obaja veľké, heterogénne kategórií. Všeobecne platí, že je nákladovo-error trade-off sa vzorkovaním non pravdepodobnosťou, ale being nižšie náklady ale vyššie chybe. Avšak, prepečený vzorkovanie non-pravdepodobnosti môže produkovať lepšie odhady ako zle odvedenej náhodnom výbere. Do budúcnosti predpokladám, že vzorkovanie non-pravdepodobnosť bude lepšie a lacnejšie, zatiaľ čo vzorkovanie pravdepodobnosť zhorší a drahšie.