3.4.3 mostra jo-probabilitare: përputhen mostër

Jo të gjitha mostrat jo-probabilitetit janë të njëjta. Ne mund të shtoni më shumë kontroll në fund para.

Qasja Wang dhe kolegët e përdorur për të vlerësuar rezultatin e zgjedhjeve presidenciale të vitit 2012 SHBA varej tërësisht në përmirësimet në analizën e të dhënave. Kjo është, ata e mbledhur sa më shumë përgjigje sa ata mund dhe pastaj u përpoq të ri-peshë e tyre. Një strategji plotësuese për të punuar me marrjen e mostrave jo-probabilitetit është që të ketë më shumë kontroll mbi procesin e mbledhjes së të dhënave.

Shembulli i thjeshtë i një procesi të marrjes së mostrave jo-probabilitetit kontrolluar pjesërisht është marrja e mostrave kuota, një teknikë që shkon prapa në ditët e para të hulumtimit të anketës. Në marrjen e mostrave të kuotave, studiuesit ndajë popullatën në grupe të ndryshme (p.sh., të rinjtë, gratë e reja, etj) dhe kuotat më pas të vendosur për numrin e njerëzve të jenë të zgjedhur në secilin grup. Të anketuarit janë përzgjedhur në mënyrë kuturu derisa studiuesi ka plotësuar kuotën e tyre në secilin grup. Për shkak të kuotave, mostra rezultuar duket më shumë si e popullsisë së synuar se do të ishte e vërtetë ndryshe, por për shkak se probabilitetet e përfshirjes janë të panjohura shumë hulumtues janë skeptikë të marrjes së mostrave kuotave. Në fakt, kuota kampionimit ishte një shkak i "Dewey Humbje Truman" gabim në 1948 anketat e SHBA presidenciale. Për shkak se ajo siguron një kontroll mbi procesin e marrjes së mostrave, megjithatë, mund të shohim se si kuota mostrave mund të ketë disa avantazhe mbi një mbledhjen e të dhënave tërësisht të pakontrolluar.

Duke lëvizur përtej marrjen e mostrave të kuotave, qasjet më moderne për kontrollin e procesit të marrjes së mostrave jo-probabilitetit janë tani të mundshme. Një qasje e tillë është quajtur përputhen mostër, dhe ajo është përdorur nga disa ofruesve komerciale linjë panel. Në formën e tij më të thjeshtë, të ngjashëm mostër kërkon dy burimet e të dhënave: 1) një regjistër të plotë të popullsisë dhe 2) një panel të madh të vullnetarëve. Është e rëndësishme që vullnetarët nuk duhet të jetë një mostër probabiliteti nga çdo popullatën; të theksoj se nuk ka kërkesa për zgjedhjen në panel, unë do të thërrasë atë një panel të pista. Gjithashtu, si regjistri i popullsisë dhe paneli pista duhet të përfshijë disa informacione ndihmëse për çdo person, në këtë shembull, unë do të marrë parasysh moshën dhe seksin, por në situata reale këto informacione ndihmëse mund të jetë shumë më e detajuar. Mashtrim i përputhjes së mostrës është për të zgjedhur mostra nga një panel të ndotur në mënyrë që prodhon mostra që duken si mostra probabilitetit.

Mostra përputhen fillon kur një mostër simuluar probabilitet është marrë nga regjistri të popullsisë; kjo mostër simuluar bëhet një mostër të synuar. Pastaj, bazuar në informacionin e ndihmëse, raste në mostër të synuar janë të krahasohen me njerëzit në panelin e pista për të formuar një mostër përputhet. Për shembull, në qoftë se ka një 25 vjeçar femër vjetër në mostër të synuar, pastaj studiuesi gjen një 25 vjeçar Femër nga paneli pista të jetë në mostër përputhet. Më në fund, anëtarët e mostrës përputhet janë intervistuar për të prodhuar seri përfundimtar të të anketuarve.

Edhe pse mostra përputhet duket si mostër të synuar, është e rëndësishme të mbani mend se mostra përputhet nuk është një mostër probabiliteti. mostrave krahasohen vetëm mund të përputhen mostrën synuar në informacionin e njohur ndihmëse (p.sh., moshës dhe gjinisë), por jo edhe në karakteristikat e pamatur. Për shembull, në qoftë se njerëzit në panelin e pista priren të jenë më të varfër-në fund të fundit, një arsye për t'u bashkuar me një panel sondazh është për të fituar para, atëherë edhe nëse mostra përputhet duket si mostër të synuar në aspektin e moshës dhe gjinisë ajo do të vazhdojë të ketë një paragjykim ndaj të varfërve. Magjia e mostrave të vërtetë probabilitetit është për të sunduar nga probleme në të dy karakteristikat e të matura dhe të pamatur (një pikë që është në përputhje me diskutimin tonë të përputhen për konkluzion shkakësore nga studimet vëzhgimor në Kapitullin 2).

Në praktikë, të ngjashëm mostrës varet nga të paturit e një paneli të madh dhe të ndryshme të etur për të përfunduar sondazheve, dhe kështu është bërë kryesisht nga kompanitë që mund të përballojë për të zhvilluar dhe për të ruajtur një panel të tillë. Gjithashtu, në praktikë, mund të ketë probleme me përputhjen (ndonjëherë një ndeshje të mirë për dikë në mostër të synuar nuk ekziston në panel) dhe mos-përgjigjes (nganjëherë njerëzit në mostër përputhet refuzojnë të marrin pjesë në sondazh). Prandaj, në praktikë, duke bërë përputhjen mostër Hulumtuesit gjithashtu kryejnë një lloj rregullimi post-stratifikimi për të bërë vlerësimet.

Është e vështirë që të ofrojë garanci të dobishme teorike rreth përputhen kampion, por në praktikë ajo mund të kryejnë mirë. Për shembull, Stephen Ansolabehere dhe Brian Schaffner (2014) në krahasim me tre anketa paralele e rreth 1,000 njerëzve të kryera në vitin 2010, duke përdorur tre marrjen e mostrave të ndryshme dhe intervistimit metoda: postë, telefon, dhe një panel në Internet duke përdorur përputhen mostër dhe rregullimin post-stratifikimit. Vlerësimet nga tre qasjet ishin mjaft të ngjashme me vlerësime nga standardeve të kualitetit të lartë të tilla si Anketa aktuale Popullsisë (CPS) dhe Anketa Kombëtare Shëndetësore Intervistë (NHIS). Më konkretisht, të dy sondazhet e internetit dhe postës ishin jashtë me një mesatare prej 3 pikë përqindje dhe studimi telefoni ishte jashtë me 4 pikë përqindjeje. Gabimet këtë të mëdha janë rreth asaj që do të presim nga mostrat e rreth 1,000 njerëzve. Edhe pse asnjë nga këto mënyra të prodhuar të dhëna të konsiderueshme më të mirë, si Internet dhe telefoni sondazh (e cila mori ditë ose javë) ishin ndjeshëm më të shpejtë në fushë sesa sondazhit postës (e cila mori tetë muaj), dhe studimi Internet, e cila përdoret përputhen mostër, ishte më e lirë se dy mënyrat e tjera.

Në përfundim, shkencëtarët socialë dhe statisticienët janë tepër skeptikë për konkluzione nga këto mostra jo-probabilitetit, pjesërisht për shkak se ata janë të lidhur me disa dështime të turpshme të kërkimit e studimit të tilla si zgjedhjet e Literary Digest. Pjesërisht, unë jam dakord me këtë skepticizëm: parregulluara mostra jo-probabilitare ka të ngjarë të prodhojë vlerësime të këqija. Megjithatë, në qoftë se studiuesit mund të përshtatet për paragjykimet në procesin e marrjes së mostrave (p.sh., pas stratifikimit) ose të kontrollojë procesin e marrjes së mostrave disi (p.sh., të ngjashëm mostër), ata mund të prodhojnë vlerësime më të mira, dhe madje edhe vlerësime të cilësisë së mjaftueshme për shumicën e qëllime. Sigurisht, do të ishte mirë për të bërë ekzekutuar të përkryer marrjen e mostrave probabilitetit, por që nuk duket të jetë një opsion realist.

Të dy mostra jo-probabilitare dhe mostrat e probabilitetit ndryshojnë në cilësinë e tyre, dhe aktualisht ka të ngjarë rasti që shumica vlerësimet nga mostrat e probabilitetit janë më të besueshme se vlerësimet nga mostrat jo-probabilitetit. Por, edhe tani, vlerësimet nga mostrat i kryer jo-probabilitetit janë ndoshta më mirë se vlerësimet nga mostrat e keq-kryera probabilitetit. Për më tepër, mostrat jo-probabilitetit janë ndjeshëm më të lirë. Kështu, duket se probabiliteti vs mostrave jo-probabilitetit ofron një kosto me cilësi të tregtisë-off (Figura 3.6). Në të ardhmen, unë pres që vlerësimet nga mostra bërë mirë jo-probabilitetit do të bëhet më e lirë dhe më e mirë. Për më tepër, për shkak të prishjes në anketat telefonike fikse dhe normat në rritje të mospërgjigjes, pres që mostra e probabilitetit do të bëhen më të shtrenjta dhe të një cilësie më të ulët. Për shkak të këtyre tendencave afatgjata, unë mendoj se jo probabiliteti mostrave do të bëhet gjithnjë e më i rëndësishëm në epokën e tretë të hulumtimit anketës.

Figura 3.6: marrjen e mostrave Probabiliteti në praktikë dhe marrjen e mostrave jo-probabilitetit janë të dyja të mëdha, kategori heterogjene. Në përgjithësi, ka një kosto-error tregtisë-off me jo-probabilitetit marrjen e mostrave të qenë me kosto të ulët, por gabimi më i lartë. Megjithatë, të mirë-bërë mostrave jo-probabilitet mund të prodhojnë vlerësime më të mira se mostrave keq-bërë probabilitetit. Në të ardhmen, unë pres që jo probabiliteti mostrave do të merrni më të mirë dhe më e lirë, ndërsa probabiliteti mostrave do të merrni më keq dhe më të shtrenjtë.

Figura 3.6: marrjen e mostrave Probabiliteti në praktikë dhe marrjen e mostrave jo-probabilitetit janë të dyja të mëdha, kategori heterogjene. Në përgjithësi, ka një kosto-error tregtisë-off me jo-probabilitetit marrjen e mostrave të qenë me kosto të ulët, por gabimi më i lartë. Megjithatë, të mirë-bërë mostrave jo-probabilitet mund të prodhojnë vlerësime më të mira se mostrave keq-bërë probabilitetit. Në të ardhmen, unë pres që jo probabiliteti mostrave do të merrni më të mirë dhe më e lirë, ndërsa probabiliteti mostrave do të merrni më keq dhe më të shtrenjtë.