3.4.3 Nie-waarskynlikheid monsters: monster ooreenstem

Nie alle nie-waarskynlikheid monsters is dieselfde. Ons kan meer beheer te voeg op die voorkant.

Die benadering Wang en kollegas wat gebruik word om die uitslag van die 2012 Amerikaanse presidensiële verkiesing skat afgehang geheel en al op die verbetering van data-analise. Dit wil sê, wat ingesamel is hulle soveel antwoorde as wat hulle kon en dan probeer om te her-gewig hulle. 'N aanvullende strategie vir die werk met nie-waarskynlikheidsteekproefneming is om meer beheer oor die data-insamelingsproses het.

Die eenvoudigste voorbeeld van 'n gedeeltelik beheer nie-waarskynlikheidsteekproefneming proses is monsterneming kwota, 'n tegniek wat terug gaan na die vroeë dae van opnamenavorsing. In voorbeeld kwota, navorsers verdeel die bevolking in verskillende groepe (bv, jongmanne, jong vroue, ens) en dan stel kwotas vir die aantal mense wat gekies in elke groep. Respondente is gekies in 'n lukraak wyse tot die navorser hul kwota in elke groep het ontmoet. As gevolg van die kwotas, die gevolglike monster lyk meer soos die teikenpopulasie as anders ware sou wees nie, maar omdat die waarskynlikhede van insluiting is onbekend baie navorsers is skepties oor monsterneming kwota. Trouens, monsterneming kwota was 'n oorsaak van die "Dewey nederlae Truman" fout in die 1948 Amerikaanse presidensiële verkiesings. Omdat dit 'n mate van beheer oor die sampling proses kan egter 'n mens sien hoe steekproefneming kwota 'n paar voordele kan hê oor 'n heeltemal onbeheerde dataversameling.

Beweeg buite monsterneming kwota, meer moderne benaderings tot die beheer van die nie-waarskynlikheidsteekproefneming proses is nou moontlik. Een so 'n benadering staan ​​bekend as voorbeeld ooreenstem, en dit is wat gebruik word deur 'n paar kommersiële aanlyn paneel voorsieners. In sy eenvoudigste vorm, monster ooreenstem vereis twee databronne: 1) 'n volledige register van die bevolking en 2) 'n groot paneel van vrywilligers. Dit is belangrik dat die vrywilligers hoef nie 'n waarskynlikheid monster van enige bevolking; beklemtoon dat daar geen vereistes vir keuring in die paneel, sal ek noem dit 'n vuil paneel. Ook, moet beide die bevolkingsregister en die vuil paneel paar hulp inligting oor elke persoon in te sluit, in hierdie voorbeeld, sal ek oorweeg ouderdom en geslag, maar in realistiese situasies hierdie hulp inligting baie meer gedetailleerde kan wees. Die truuk van die monster wat ooreenstem is om monsters van 'n vuil paneel kies op 'n manier dat monsters wat lyk soos waarskynlikheid monsters produseer.

Monster ooreenstem begin wanneer 'n gesimuleerde waarskynlikheid monster geneem uit die register bevolking; hierdie gesimuleerde monster word 'n teiken monster. Dan, gebaseer op die hulp inligting gevalle in die teiken monster is gekoppel aan mense in die vuil paneel om 'n pas monster te vorm. Byvoorbeeld, indien daar is 'n 25-jarige vrou in die teiken monster, dan is die navorser bevind 'n 25-jarige vrou van die vuil paneel te wees in die pas monster. Ten slotte, lede van die pas monster is 'n onderhoud met die finale stel van die respondente te produseer.

Selfs al is die pas monster lyk die teiken monster, is dit belangrik om te onthou dat die pas monster is nie 'n waarskynlikheid monster. Ooreenstem monsters kan net ooreenstem met die teiken monster op die bekende hulp inligting (bv, ouderdom en geslag), maar nie op onmeetlike eienskappe. Byvoorbeeld, as mense op die vuil paneel is geneig om armer-na alles wees, een van die redes om aan te sluit 'n opname paneel is om geld-dan verdien selfs al is die pas monster lyk die teiken monster in terme van ouderdom en geslag sal dit nog 'n vooroordeel teenoor arm mense. Die magie van ware waarskynlikheidsteekproefneming is om te heers oor probleme op beide gemeet en onmeetlike eienskappe (a punt wat in ooreenstemming is met ons bespreking van wat ooreenstem met die vir kousale inferensie uit waarnemingstudies in Hoofstuk 2).

In die praktyk, monster ooreenstem hang af van 'n groot en diverse paneel gretig om opnames te voltooi, en dit is dus hoofsaaklik gedoen deur maatskappye wat nie kan bekostig om te ontwikkel en in stand te hou so 'n paneel. Ook, in die praktyk, kan daar probleme met bypassende (soms 'n goeie wedstryd vir iemand in die teiken monster bestaan ​​nie op die paneel) en nie-reaksie (soms mense in die pas monster weier om deel te neem in die opname) wees. Daarom, in die praktyk, navorsers doen monster ooreenstem ook 'n soort van post-stratifikasie aanpassing skattings te maak uit te voer.

Dit is moeilik om nuttige teoretiese waarborge oor monster ooreenstem voorsien, maar in die praktyk is dit goed kan doen. Byvoorbeeld, Stephen Ansolabehere en Brian Schaffner (2014) vergelyk drie parallelle opnames van ongeveer 1000 mense wat in 2010 met behulp van drie verskillende monsters en onderhoudvoering metodes: pos, telefoon, en 'n Internet paneel met behulp monster ooreenstem en post-stratifikasie aanpassing. Die raming van die drie benaderings was baie soortgelyk aan ramings van 'n hoë-gehalte standaarde soos die huidige bevolking Survey (CPS) en die Nasionale Gezondheidsenquête (NHIS). Meer spesifiek, beide op die Internet en e-pos opnames was af met 'n gemiddeld van 3 persentasiepunte en die telefoon opname was af met 4 persentasiepunte. Foute hierdie groot is ongeveer wat 'n mens sou verwag van monsters van ongeveer 1000 mense. Hoewel nie een van hierdie wyses geproduseer aansienlik beter data, beide op die Internet en telefoon opname (wat het dae of weke) aansienlik vinniger was om veld as die pos-opname (wat agt maande het), en die Internet opname, wat monster ooreenstem gebruik, was goedkoper as die ander twee vorme.

Ten slotte, sosiale wetenskaplikes en statistici is ongelooflik skepties oor afleidings uit hierdie nie-waarskynlikheid monsters, deels omdat hulle in verband met 'n paar verleentheid mislukkings van opnamenavorsing soos die literêre Digest meningspeiling. In deel, Ek stem saam met hierdie skeptisisme: onaangepaste nie-waarskynlikheid monsters is geneig om slegte skat produseer. Maar as navorsers kan aanpas vir die vooroordele in die monsterneming proses (bv, post-stratifikasie) of 'n bietjie beheer oor die sampling proses (bv, monster ooreenstem), hulle kan beter skattings, en selfs skattings van voldoende gehalte vir die meeste doeleindes vervaardig. Natuurlik, sou dit beter wees om perfek uitgevoer waarskynlikheidsteekproefneming te doen, maar dit lyk nie meer 'n realistiese opsie wees.

Beide nie-waarskynlikheid monsters en waarskynlikheid monsters verskil in hul gehalte, en op die oomblik is dit waarskynlik die geval dat die meeste ramings van waarskynlikheid monsters is meer betroubaar as skattings van nie-waarskynlikheid monsters. Maar, selfs nou, skattings van goed gedoen nie-waarskynlikheid monsters is waarskynlik beter as skattings van swak gedoen waarskynlikheid monsters. Verdere, nie-waarskynlikheid monsters is aansienlik goedkoper. So, blyk dit dat waarskynlikheid vs nie-waarskynlikheidsteekproefneming bied 'n koste-gehalte kompromis (Figuur 3.6). Ons sien daarna uit, ek verwag dat skattings van goed gedoen nie-waarskynlikheid monsters goedkoper en beter sal word. Verdere, as gevolg van die ineenstorting van landlyn telefoon opnames en die verhoging van pryse van nie-reaksie, ek verwag dat waarskynlikheid monsters duurder geword en van laer gehalte. As gevolg van hierdie langtermyn tendense, ek dink dat nie-waarskynlikheidsteekproefneming al hoe belangriker in die derde era van opnamenavorsing sal word.

Figuur 3.6: waarskynlikheidsteekproefneming in die praktyk en nie-waarskynlikheidsteekproefneming is beide groot, heterogene kategorieë. In die algemeen, daar is 'n koste-fout kompromis met nie-waarskynlikheidsteekproefneming om laer koste, maar hoër fout. Dit kan egter goed gedoen nie-waarskynlikheidsteekproefneming beter skattings as swak gedoen waarskynlikheidsteekproefneming te produseer. In die toekoms, ek verwag dat nie-waarskynlikheidsteekproefneming beter en goedkoper terwyl waarskynlikheidsteekproefneming erger en duurder sal kry sal kry.

Figuur 3.6: waarskynlikheidsteekproefneming in die praktyk en nie-waarskynlikheidsteekproefneming is beide groot, heterogene kategorieë. In die algemeen, daar is 'n koste-fout kompromis met nie-waarskynlikheidsteekproefneming om laer koste, maar hoër fout. Dit kan egter goed gedoen nie-waarskynlikheidsteekproefneming beter skattings as swak gedoen waarskynlikheidsteekproefneming te produseer. In die toekoms, ek verwag dat nie-waarskynlikheidsteekproefneming beter en goedkoper terwyl waarskynlikheidsteekproefneming erger en duurder sal kry sal kry.