3.4.3 Vzorky Non-pravděpodobnostní: vzorek odpovídající

Tento překlad byl vytvořen na počítači. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 Vzorky Non-pravděpodobnostní: vzorek odpovídající

Ne všechny vzorky non-pravděpodobnostní jsou stejné. Můžeme přidat větší kontrolu na přední straně.

Přístup Wang a jeho kolegové používají odhadnout výsledek v roce 2012 amerických prezidentských voleb závisel výhradně na zlepšení v analýze dat. To znamená, že shromážděné tolik odpovědí, jak jen mohli, a pak se pokusil re-váha je. Doplňkovou strategii pro práci s odběrem vzorků non-pravděpodobnostní je mít větší kontrolu nad procesem sběru dat.

Nejjednodušším příkladem částečně řízeného procesu vzorkování non-pravděpodobnostní vzorkování je kvóta, technika, která sahá až do prvních dnů výzkumného šetření. Při odběru kvót, výzkumníci rozdělit populaci do různých skupin (například mladí muži, mladé ženy, atd) a pak nastavit kvóty pro počet osob, které mají být vybrány v každé skupině. Respondenti jsou vybírány nahodile, dokud se výzkumný pracovník nesplní svou kvótu v každé skupině. Vzhledem k tomu, kvót, výsledný vzorek vypadá spíš jako cílové populace, než by bylo jinak true, ale proto, pravděpodobnosti zahrnutí nejsou známy mnozí badatelé jsou skeptičtí odběru vzorků kvóty. Ve skutečnosti, vzorkování kvóta byla příčinou "Dewey porazí Trumana" Chyba v 1948 amerických prezidentských volbách. Vzhledem k tomu, že poskytuje určitou kontrolu nad procesu vzorkování, nicméně, je vidět, jak odběr kvóta může mít některé výhody v průběhu sběru dat zcela nekontrolované.

Pohybující se nad rámec odběru vzorků kvót, další moderní přístupy k řízení procesu vzorkování non-pravděpodobnostní jsou nyní možné. Jeden takový přístup se nazývá vzorek vyhovující, a je používán některými komerčních poskytovatelů on-line panelu. Ve své nejjednodušší podobě vzorek odpovídající vyžaduje dva zdroje dat: 1) kompletní evidenci obyvatel a 2) velký panel dobrovolníků. Je důležité, že dobrovolníci nemusí být vzorek pravděpodobnost z jakékoliv populace; zdůraznit, že neexistují žádné požadavky pro výběr do panelu, zavolám to špinavá panel. Také, jak registr obyvatelstva a špinavá panel musí obsahovat nějaké pomocné údaje o každé osobě, v tomto případě budu uvažovat o věk a pohlaví, ale v reálných situacích tato pomocná informace by mohly být mnohem podrobnější. Trik shoda vzorku je výběr vzorků z špinavé panelu takovým způsobem, který produkuje vzorky, které vypadají jako pravděpodobnostních výběrů.

Vzorek odpovídající začíná, když je simulovaný vzorek pravděpodobnost převzat z registru obyvatel; Tento simulované vzorek se stává terčem vzorek. Pak, na základě pomocné informace případů v cílovém vzorku jsou přizpůsobeny pro lidi ve špinavé panelu pro vytvoření přizpůsobeného vzorku. Například, jestliže tam je 25 letá žena v cílovém vzorku, pak výzkumník nalezne 25 let Žena jsem z špinavé panelu být v porovnané vzorku. Nakonec členové porovnané vzorku jsou dotazováni vyrábět konečnou sadu respondentů.

I když je uzavřeno vzorek vypadá jako cílového vzorku, je důležité mít na paměti, že uzavřeno vzorek není vzorek pravděpodobnost. Spárované vzorky mohou odpovídat pouze cílový vzorek na známou pomocnou informací (například věk a pohlaví), ale ne na neměřených charakteristik. Například, pokud lidé na špinavé panelu bývají chudší koneckonců, jeden z důvodů, spojit průzkum panel je vydělávat peníze, pak i když je uzavřeno vzorku bude vypadat cílovém výběru z hlediska věku a pohlaví bude stále mít zaujatost vůči chudým lidem. Kouzlo pravého náhodném výběru je vyloučit problémů na obou měřených i neměřených vlastnostmi (bod, který je v souladu s naší diskusi o odpovídající za příčinné závěr z pozorovacích studií v kapitole 2).

V praxi se vzorek odpovídající závisí na tom, že má velký a různorodý panel dychtivý o vyplnění dotazníku, a proto se provádí hlavně firmy, které si mohou dovolit rozvíjet a udržovat takový panel. Také v praxi, tam může být problémy s odpovídající (někdy dobrý zápas pro někoho v cílovém vzorku neexistuje na panelu) a non-response (někdy lidé v porovnané vzorku odmítnout účast v průzkumu). Proto se v praxi výzkumníci dělají ve stejném vzorku také provést nějaké úpravy post-stratifikace, aby odhady.

Je těžké poskytnout užitečné teoretické záruky o vyrovnání vzorku, ale v praxi to může fungovat dobře. Například Stephen Ansolabehere a Brian Schaffner (2014) ve srovnání tři paralelní průzkumy asi 1000 lidí provedených v roce 2010 s použitím tří různých vzorkování a interview metody: mail, telefon a internetový panel s použitím vzorku věcné a nastavení post-stratifikace. Odhady ze tří přístupů byly dost podobné odhadů z vysoce kvalitních měřítek jako je aktuální populačního průzkumu (CPS) a National Health Interview Survey (NZIS). Přesněji řečeno, oba průzkumy internet a poštovní byli pryč v průměru o 3 procentní body a průzkum telefon byl vypnutý o 4 procentní body. Chyby toto velké jsou zhruba to, co by se dalo očekávat ze vzorků asi 1000 lidí. Ačkoliv žádná z těchto režimů vyrobených podstatně lepší data, jak internet a telefonní průzkum (což trvalo dny nebo týdny), byly podstatně rychlejší pole než poštovní průzkumu (což trvalo osm měsíců), a průzkum internetu, který používal ve stejném vzorku, byl levnější než ostatní dva režimy.

Závěrem lze říci, sociologové a statistici jsou neuvěřitelně skeptický ohledně závěrů z těchto vzorků non-pravděpodobnosti, z části proto, že jsou spojeny s některými trapné selhání výzkumného šetření jako je Literární Digest hlasování. Zčásti souhlasím s tímto skepticky: neupravené vzorky non-pravděpodobnostní budou pravděpodobně produkovat špatné odhady. Nicméně, pokud výzkumníci lze nastavit pro vychýlení v procesu vzorkování (například post-stratifikace), nebo řídit proces vzorkování poněkud (např vzorek odpovídající), mohou dosáhnout lepších odhadů a dokonce i odhady dostatečně kvalitní pro většinu účelů. Samozřejmě, že by bylo lepší udělat dokonale provedený odběr vzorků pravděpodobnosti, ale to už se zdá být reálnou možností.

Oba vzorky non-pravděpodobnostní a vzorky pravděpodobnost liší v jejich kvalitě, a v současné době je pravděpodobné, že v případě, že většina odhadů z pravděpodobnostních výběrů jsou důvěryhodnější než odhady ze vzorků non-pravděpodobnosti. Ale i teď, odhady z dobře provedených vzorků non-pravděpodobnostních jsou pravděpodobně lepší než odhady ze špatně provedených pravděpodobnostních výběrů. Dále, vzorky non-pravděpodobnostní jsou podstatně levnější. Tak se zdá, že pravděpodobnost vs vzorkování non-pravděpodobnostní nabízí cenově kvalitní trade-off (obrázek 3.6). Při pohledu do budoucna očekávám, že odhady z dobře provedených vzorků non-pravděpodobností bude levnější a lépe. Dále, protože zhroucení pevné telefonní průzkumy a narůstajícím výskytem non-response, předpokládám, že vzorky pravděpodobností bude dražší a méně kvalitní. Vzhledem k těmto dlouhodobých trendů, myslím, že výběr vzorku non-pravděpodobnosti stane ve třetí době výzkumného šetření stále důležitější.

Obrázek 3.6: vzorkování Pravděpodobnost v praxi a odběr vzorků non-pravděpodobnostní jsou oba velké, heterogenní kategorií. Obecně platí, že je cenově chyba trade-off se vzorkovací non-pravděpodobnost, že nižší náklady, ale vyšší chybě. Nicméně, propečený vzorkování non-pravděpodobnosti může produkovat lepší odhady než špatně odvedené náhodném výběru. Do budoucna předpokládám, že vzorkování non-pravděpodobnost bude lepší a levnější, zatímco vzorkování pravděpodobnost zhorší a dražší.