3.4.2 Vzorky Non-pravděpodobnostní váhové:

Se vzorky non-pravděpodobnosti, mohou váhy vrátit zpět narušení způsobených předpokládaným procesu vzorkování.

Stejným způsobem, že výzkumníci hmotnost odpovědi od pravděpodobnostních výběrů, mohou také vážit odpoví vzorků non-pravděpodobnosti. Například, jako alternativa k CPS, představte si, že jste umístili bannerové reklamy na tisíce internetových stránek pro nábor účastníků průzkumu, který odhad míry nezaměstnanosti. Samozřejmě, měli byste být skeptický, že prostý průměr Vašeho vzorku by byl dobrý odhad míry nezaměstnanosti. Vaše skepse je pravděpodobně proto, že si myslíte, že někteří lidé mají větší šanci dokončit svůj průzkum než ostatní. Například lidé, kteří nemají tráví hodně času na internetu, jsou méně pravděpodobné, že k dokončení průzkumu.

Jak jsme viděli v poslední části, ale pokud víme, jak vzorek byl vybrán, jako to děláme s pravděpodobností vzorky, pak se můžeme vrátit narušení způsobených procesu vzorkování. Bohužel, při práci se vzorky non-pravděpodobnosti, nevíme, jak byl vybrán vzorek. Ale můžeme učinit předpoklady o procesu vzorkování a pak aplikovat váhu stejným způsobem. Pokud se tyto předpoklady jsou správné, pak se váha vrátí zpět deformace způsobené procesu vzorkování.

Například si představte, že v reakci na vaše bannerové reklamy, budete přijati 100.000 respondentů. Nicméně, vy nevěříte, že tyto 100,000 respondenti jsou jednoduchým náhodný vzorek dospělých Američanů. Ve skutečnosti, když si porovnat své respondenty, aby populace USA, zjistíte, že lidé z některých státech (např New York) jsou ve velké míře zastoupeni a že lidé z některých státech (např Alaska) jsou nedostatečně zastoupeny. To znamená, že míra nezaměstnanosti Vašeho vzorku je pravděpodobné, že bude špatný odhad míry nezaměstnanosti v cílové populaci.

Jeden způsob, jak vrátit zpět zkreslení, které se stalo v procesu vzorkování je přiřadit váhy pro každou osobu; Nižší hmotnost pro lidi ze států, které jsou nadměrně zastoupeny ve vzorku (například New York) a vyšších hmotností lidem ze států, které jsou nedostatečně zastoupeny ve vzorku (např Aljaška). Přesněji řečeno, je hmotnost pro každou respondenta souvisí s jejich výskytu v vzorek ve srovnání s jejich výskyt v populaci USA. Toto vážení postup se nazývá post-stratifikace, a myšlenka na vážení by vám měla připomenout například v kapitole 3.4.1, kde respondenti z Rhode Island dostaly menší váhu než respondenti z Kalifornie. Post-stratifikace vyžaduje, že víte dost, aby vaše respondenty do skupin a znát podíl cílové populace v každé skupině.

I když se váha vzorku pravděpodobnosti a vzorku non-pravděpodobnosti jsou stejné matematicky (viz technická příloha), které dobře fungují v různých situacích. V případě, že výzkumný pracovník má dokonalý vzorek pravděpodobnost (tj žádná chyba pokrytí a ne non-odezva), potom vážení bude vyrábět nestranné odhady pro všechny znaky ve všech případech. Tento silný teoretický záruka je důvod, proč zastánci pravděpodobnostních výběrů najít je tak atraktivní. Na druhou stranu, bude vážení vzorky non-pravděpodobnostní vyrábět pouze nestranné odhady pro všechny znaky v případě, že sklony reakce jsou stejné pro každého v každé skupině. Jinými slovy, na mysli zpět k našemu příkladu, za použití post-vrstvení vytvoří nezkreslené odhady, když každý v New Yorku, má stejnou pravděpodobnost účasti a každý na Aljašce má stejnou pravděpodobnost se účastní, a tak dále. Tento předpoklad se nazývá předpoklad homogenních-reakce-sklonů-rámci skupin, a to hraje klíčovou roli v vědět, zda post-stratifikace bude dobře pracovat se vzorky non-pravděpodobnosti.

Bohužel, v našem případě se zdá nepravděpodobné, že by to byla pravda předpoklad homogenního-odezva-sklony-v-skupin. To znamená, že se zdá nepravděpodobné, že by každý na Aljašce má stejnou pravděpodobnost, že ve svém průzkumu. Ale existují tři důležité body mít na paměti, o post-stratifikace, z nichž všechny zdát nadějnější.

Za prvé, homogenní-reakce-sklony-v-skupin předpoklad se stává pravděpodobnější jako počet zvyšuje skupiny. A, výzkumníci nejsou omezeny na skupiny jen na základě jedné konkrétní geografické rozměr. Například bychom mohli vytvořit skupiny založené na stavu, věku, pohlaví a úrovně vzdělání. Zdá se pravděpodobnější, že je homogenní sklony odpověď ve skupině 18-29, absolventi ženského, kolej žijící na Aljašce, než ve skupině všech lidí žijících na Aljašce. Tak, jako je počet skupin, použitých pro zvýšení post-stratifikace předpoklady potřebné pro podporu se stane rozumnější. Vzhledem k této skutečnosti, vypadá to, že vědci chtěli vytvořit obrovský počet skupin pro post-stratifikace. Ale, jak s rostoucím počtem skupin, vědci narazí na jiný problém: datové řídkost. Pokud existuje pouze malý počet osob v každé skupině, pak odhady budou nejistá, a v krajním případě, kdy je skupina, která nemá žádné respondenty, poté post-stratifikace zcela zhroutí. Existují dva způsoby, jak z této přirozené napětí mezi věrohodnosti homogeneous- odezva-sklon-v-skupiny za předpokladu a poptávkou po rozumnou velikostí vzorku v každé skupině. Jednou z možností je přejít na sofistikovanější statistického modelu pro výpočet vah a druhý je shromáždit větší a rozmanitější vzorek, který pomáhá zajistit přiměřené velikosti vzorku v každé skupině. A někdy výzkumníci dělat obojí, jak budu popisovat níže více podrobností.

Druhým hlediskem při práci s následnou stratifikaci ze vzorků non-pravděpodobnost, že předpoklad homogenního-response-sklon-v-skupin je již často provádí při analýze vzorků pravděpodobnosti. Důvod, že tento předpoklad je potřeba pro vzorky pravděpodobnosti v praxi je to, že vzorky mají pravděpodobnost non-odpověď, a nejběžnější metodou pro úpravu non-response je post-stratifikace, jak bylo popsáno výše. Samozřejmě, jen proto, že mnoho výzkumníků učinit určitý předpoklad, neznamená, že byste to měli dělat taky. Ale to znamená, že při porovnávání vzorků non-pravděpodobnost náhodných výběrových v praxi, musíme mít na paměti, že oba jsou závislé na předpokladech a pomocných informací za účelem vypracování odhadů. Ve většině realistických nastaveních, tam je prostě žádný předpoklad, bez přístupu k závěru.

A konečně, pokud vám záleží na jedno odhad především-V našem příkladu míra nezaměstnanosti, pak je třeba podmínku slabší než předpokladu homogenní odezvy-sklon-max-skupiny. Konkrétně, nemusíte předpokládat, že každý má stejný sklon odpovědí, stačí předpokládat, že neexistuje žádná korelace mezi sklonem odezvy a míry nezaměstnanosti v rámci každé skupiny. Samozřejmě, že i tento slabší podmínka neplatí v některých situacích. Představte si například, odhadování podílu Američanů, která se stala dobrovolnicí. Pokud se lidé, kteří se stala dobrovolnicí je pravděpodobnější, že souhlasí s tím, že v průzkumu, pak výzkumníci budou systematicky over-odhadnout množství dobrovolnictví, i když dělají úpravy post-stratifikace, což je výsledek, který je prokázáno empiricky Abraham, Helms, and Presser (2009) .

Jak jsem již řekl dříve, vzorky non-pravděpodobnostní jsou vnímány s velkým skepticismem sociology, částečně kvůli své roli v některé z nejvíce trapné selhání v prvních dnech výzkumného šetření. Jasným příkladem toho, jak daleko jsme došli se vzorky non-pravděpodobnostních je výzkum Wei Wang, David Rothschild, Sharad Goel, a Andrew Gelman, které správně zpět výsledek v roce 2012 amerických volbách použití vzorku non-pravděpodobnostní uživatelů American Xbox -a rozhodně non-náhodný vzorek Američanů (Wang et al. 2015) . Výzkumných pracovníků přijatých respondentů z herního systému Xbox, a jak se dalo očekávat, vzorek Xbox zkreslený samce a vychýlená mladých: 18-29 letých tvoří 19% voličů, ale 65% vzorku Xbox a muži tvoří 47% voličů a 93% vzorku Xbox (obrázek 3.4). Kvůli těmto silným demografickým předsudků, nezpracovaná data Xbox byl chudý indikátor volebních výnosů. To předpovídal silné vítězství nad Mitt Romney Barack Obama. Opět platí, že toto je další příklad nebezpečí surovin neupravených vzorků non-pravděpodobnostních a připomíná Literary Digest fiasko.

Obrázek 3.4: Demografie respondentů v Wang et al. (2015). Vzhledem k tomu, respondenti byli rekrutováni od XBox, oni byli více pravděpodobné, že bude mladý a častěji muži, vzhledem k voliči ve volbách 2012.

Obrázek 3.4: Demografie respondentů v Wang et al. (2015) . Vzhledem k tomu, respondenti byli rekrutováni od XBox, oni byli více pravděpodobné, že bude mladý a častěji muži, vzhledem k voliči ve volbách 2012.

Nicméně, Wang a jeho kolegové byli vědomi těchto problémů a pokoušel se vážení respondentů ke korekci procesu vzorkování. Zejména se používají sofistikovanější formu post-stratifikaci jsem ti o. Stojí za to učit něco víc o jejich přístupu, protože to vytváří intuice o post-rozvrstvení, a to zejména verze Wang a kolegové použili je jedním z nejvíce vzrušujících přístupů k vážení vzorků non-pravděpodobnosti.

V našem jednoduchém příkladu týkající se odhadu nezaměstnanosti v kapitole 3.4.1, jsme rozdělili obyvatelstvo do skupin na základě stavu bydliště. V kontrastu, Wang a jeho kolegové rozdělil obyvatelstvo do do 176,256 skupin definovaných: pohlaví (2 kategorie), rasa (4 kategorie), věk (4 kategorie), vzdělání (4 kategorie), stát (51 kategorií), ID strany (3 kategorie), ideologie (3 kategorie) a 2008 hlasování (3 kategorie). S více skupinami, vědci doufali, že by bylo stále více pravděpodobné, že v každé skupině, sklon reakce byla nekorelované s podporou Obama. Dále spíše než konstrukci vah individuální úrovni, jako jsme to udělali v našem příkladu, Wang a jeho kolegové použili komplexního modelu pro odhad podílu lidí v každé skupině, která by hlasovat pro Obamu. Nakonec se kombinovat tyto odhady skupinové podpory se známou velikostí každé skupiny k produkci odhadovanou celkovou úroveň podpory. Jinými slovy, oni rozsekána obyvatelstvo do různých skupin, odhaduje podporu pro Obamu v každé skupině, a pak se vážený průměr odhadů skupiny produkovat celkový odhad.

To znamená, že velkou výzvou v jejich přístupu je odhad podporu pro Obamu v každé z těchto skupin 176,256. Ačkoli jejich panel zahrnuty 345,858 unikátních účastníků, obrovské množství podle měřítek volebního dotazování, tam bylo mnoho, mnoho skupin, pro něž Wang a jeho kolegové měli téměř žádné respondentů. Proto odhadnout podporu v každé skupině, kterou použili techniku ​​zvanou víceúrovňová regresní s post-stratifikace, který vědci nazývají láskou P. V zásadě odhadnout podporu pro Obamu v rámci určité skupiny, pan P. bazény informace z mnoha úzce souvisí skupiny. Například, zvažovat výzvu odhadu podporu pro Obamu mezi ženskými, Hispánců, mezi 18-29 let, kteří jsou vysokoškolští absolventi, kteří jsou registrovaní demokraté, kdo self-identifikovat jako umírněné, a kdo hlasovali pro Obamu v roce 2008. Tento je to velmi, velmi specifická skupina, a je možné, že se nikdo ve vzorku s těmito charakteristikami. Proto, aby se odhady o této skupině, pan P. bazény spolu odhaduje od lidí ve velmi podobnými skupinami.

Při použití této strategie analýzy, Wang a jeho kolegové byli schopni používat Xbox vzorku non-pravděpodobnostní velmi pečlivě odhadnout celkovou podporu, kterou Obama obdržel ve volbách 2012 (Obrázek 3.5). Ve skutečnosti se jejich odhady byly přesnější než souhrn výzkumů veřejného mínění. Tak, v tomto případě váhové konkrétně pan P., zdá se, dělat dobrou práci oprava zaujatosti v datech non-pravděpodobnosti; předsudky, které jsou viditelné, když se podíváte na odhadů z neupravených údajů Xbox.

Obrázek 3.5: Odhady z Wang et al. (2015). Neupravené XBox získaný vzorek nepřesné odhady. Ale vážený XBox získaný vzorek odhady, které byly přesnější než v průměru telefonních průzkumů pravděpodobnosti bázi.

Obrázek 3.5: Odhady z Wang et al. (2015) . Neupravené XBox získaný vzorek nepřesné odhady. Ale vážený XBox získaný vzorek odhady, které byly přesnější než v průměru telefonních průzkumů pravděpodobnosti bázi.

Existují dva hlavní poznatky ze studia Wang a kolegy. Za prvé, neupravené vzorky non-pravděpodobnostní může vést ke špatným odhadům; To je poučení, že mnozí vědci slyšel. Nicméně Druhým poučením je, že vzorky non-pravděpodobnostní, pokud je správně vyvážené, může skutečně produkovat docela dobré odhady. Ve skutečnosti, jejich odhady byly přesnější než odhady z pollster.com, agregace více tradičních volebních průzkumů.

A konečně, existují významná omezení toho, co se můžeme naučit z této jedné konkrétní studie. Jen proto, že post-stratifikace fungovaly dobře v tomto konkrétním případě, neexistuje žádná záruka, že to bude dobře fungovat v jiných případech. Ve skutečnosti, volby jsou možná jedním z nejjednodušších nastavení, protože pollsters studovali voleb téměř 100 let, tam je pravidelná zpětná vazba (můžeme vidět, kdo vyhraje volby), a stranická identifikace a demografické charakteristiky jsou relativně prediktivní hlasování. V tomto okamžiku nám chybí solidní teorii a empirických zkušeností vědět, kdy o hmotnosti úpravy vzorků non-pravděpodobností budou produkovat dostatečně přesné odhady. Jedna věc, která je však jasné, je, pokud jsou nuceny pracovat se vzorky non-pravděpodobnosti, pak je tu silný důvod se domnívat, že upravené odhady bude lepší než neočištěných odhadů.