3.4.2 mostra jo-probabilitetit: peshimit

Ky përkthim u krijua nga një kompjuter. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 mostra jo-probabilitetit: peshimit

Me mostrat jo-probabilitetit, pesha mund të prish deformimet e shkaktuara nga procesi i supozuar mostrave.

Në të njëjtën mënyrë që studiuesit peshës përgjigjet nga mostrat e probabilitetit, ata gjithashtu mund të peshës përgjigjet nga mostrat jo-probabilitetit. Për shembull, si një alternativë për të CPS, imagjinoni se ju të vendosur reklama flamurin në mijëra faqet e internetit për të rekrutuar pjesëmarrësit për një sondazh për të vlerësuar shkallën e papunësisë. Natyrisht, ju do të jetë skeptik se mesatarja e thjeshtë e mostrës tuaj do të jetë një vlerësim i mirë i shkallës së papunësisë. Skepticizmi juaj është ndoshta për shkak se ju mendoni se disa njerëz kanë më shumë gjasa për të përfunduar sondazh tuaj se të tjerët. Për shembull, njerëzit që nuk kalojnë shumë kohë në internet kanë më pak gjasa për të përfunduar sondazh tuaj.

Siç e pamë në seksionin e fundit, megjithatë, në qoftë se ne e dimë se si është përzgjedhur mostra-si ne bëjmë me të probabilitetit mostra, atëherë ne mund të prish deformimet e shkaktuara nga procesi i marrjes së mostrave. Për fat të keq, kur punojnë me mostrat jo-probabilitetit, ne nuk e dimë se si është përzgjedhur mostra. Por, ne mund të bëjë supozime në lidhje me procesin e marrjes së mostrave dhe pastaj të aplikojnë peshë në të njëjtën mënyrë. Në qoftë se këto supozime janë të sakta, atëherë ponderimi do të zhbëhen shtrembërimet e shkaktuara nga procesi i marrjes së mostrave.

Për shembull, imagjinoni se në përgjigje të reklama juaj flamurin, ju rekrutuar 100.000 të anketuar. Megjithatë, ju nuk besoj se këto 100.000 të anketuarit janë një mostër e thjeshtë e rastit e të rriturve amerikanë. Në fakt, kur ju krahasoni anketuarve tuaja të popullsisë amerikane, ju gjeni se njerëzit nga disa shtete (p.sh., New York) mbi-përfaqësuara dhe se njerëzit nga disa shtete (p.sh., Alaska) janë të nën-përfaqësuara. Kështu, shkalla e papunësisë së mostrës tuaj ka të ngjarë të jetë një vlerësim i keq e shkallës së papunësisë në popullsinë e synuar.

Një mënyrë për të ndrequr shtrembërim që ka ndodhur në procesin e marrjes së mostrave është të caktojë peshave për çdo person; pesha më e ulët për njerëzit nga shtetet që janë të mbi-përfaqësuar në mostër (p.sh., Nju Jork) dhe pesha më të larta për njerëzit nga shtetet që janë të nën-përfaqësuara në mostër (p.sh., Alaska). Më konkretisht, pesha për çdo paditur ka të bëjë me përhapjen e tyre në mostër tuaj në lidhje me përhapjen e tyre në popullsinë amerikane. Kjo procedurë quhet koeficient post-shtresim, dhe ideja e peshon duhet të ju kujtoj për shembull, në nenin 3.4.1, ku të anketuarit nga Rhode Island janë dhënë më pak peshë se të anketuarit nga Kalifornia. Post-shtresim kërkon që ju e dini të mjaftueshme për të vënë të anketuarit tuaja në grupe dhe për të ditur përqindjen e popullsisë të synuar në çdo grup.

Edhe pse pesha e mostrës së probabilitetit dhe e mostrës jo-probabilitetit janë të njëjtë matematikisht (shih shtojcën teknike), ata punojnë edhe në situata të ndryshme. Në qoftë se studiuesi ka një mostër të përsosur probabilitetit (dmth, nuk ka gabim mbulimit dhe asnjë jo-përgjigje), atëherë koeficient do të prodhojnë vlerësime të paanshme për të gjitha tiparet në të gjitha rastet. Kjo garanci e fortë teorike është arsyeja pse avokatët e mostrave probabilitetit të gjetur ata në mënyrë tërheqëse. Nga ana tjetër, koeficient mostra jo-probabilitare do të prodhojë vetëm vlerësime të paanshme për të gjitha tiparet në qoftë se tendenca të përgjigjes janë të njëjta për të gjithë në secilin grup. Me fjalë të tjera, duke menduar përsëri në shembullin tonë, duke pas-shtresimit do të prodhojnë vlerësime të paanshme nëse të gjithë në Nju Jork ka të njëjtin probabilitet të marrin pjesë dhe të gjithë në Alaskë ka të njëjtin probabilitet të marrin pjesë dhe kështu me radhë. Ky supozim është quajtur homogjene-përgjigje-prirje-brenda-grupet supozim, dhe ajo luan një rol kyç për të ditur nëse post-shtresim do të punojnë edhe me mostrat jo-probabilitetit.

Për fat të keq, në shembullin tonë, supozimi homogjene-përgjigje-tendenca të-brenda-grupeve duket se ka gjasa të jetë e vërtetë. Që është, duket e pamundur që të gjithë në Alaskë ka të njëjtin probabilitet për të qenë në hulumtimin tuaj. Por, ka tre pika të rëndësishme për të mbajtur në mendje në lidhje me post-shtresimit, të cilat e bëjnë atë të duket më premtuese.

Së pari, homogjene-përgjigje-tendenca të-brenda-grupeve supozimi bëhet më e besueshme si numri i grupeve të rritet. Dhe, studiuesit nuk janë të kufizuara në grupet vetëm bazuar në një dimension të vetëm gjeografik. Për shembull, ne mund të krijojë grupe në bazë të shtetit, moshës, gjinisë, dhe niveli i arsimimit. Duket më e besueshme se ka tendenca të përgjigje homogjene brenda grupin e 18-29, të diplomuarit femra, kolegj jetojnë në Alaskë se brenda grupit të të gjithë njerëzve që jetojnë në Alaskë. Kështu, si numri i grupeve të përdoren për rritjen e post-shtresimit, supozimet e nevojshme për të mbështetur atë të bëhet më e arsyeshme. Duke pasur parasysh këtë fakt, kjo duket si një studiues do të duan për të krijuar një numër të madh të grupeve për pas stratifikimit. Por, si numri i grupeve të rritet, hulumtuesit të kandidojë në një tjetër problem: Shpërndarja e Madhe e të dhënave. Nëse ka vetëm një numër i vogël i njerëzve në secilin grup, atëherë vlerësimet do të jenë më të pasigurt, dhe në rastin ekstrem, ku ka një grup që nuk ka të anketuar, pastaj pas-shtresim tërësisht prishet. Ka dy mënyra nga ky tension qenësishme ndërmjet besueshmërisë së homogeneous- Përgjigja-prirje-brenda-grupeve supozim dhe kërkesa për madhësi të arsyeshme të mostrës në secilin grup. Një mënyrë është për të kaluar në një model më të sofistikuar statistikore për llogaritjen e peshave dhe të tjera është që të mbledhë një mostër, madhe shumë të larmishme, e cila ndihmon të siguruar madhësive të arsyeshme mostër në secilin grup. Dhe, ndonjëherë hulumtuesit bëjë të dyja, si unë do të përshkruaj më në detaje më poshtë.

Një konsideratë e dytë kur punojnë me të pas-shtresim nga mostra jo-probabilitetit është se supozimi homogjene-përgjigje-prirje-brenda-grupeve tashmë është bërë shpesh kur analizuar mostrat e probabilitetit. Arsyeja që ky supozim është e nevojshme për mostrat e probabilitetit në praktikë është se mostrat e probabilitetit kanë jo-përgjigje, dhe metoda më e zakonshme për të përshtatur për mos-përgjigjes është post-shtresim siç përshkruhet më sipër. Natyrisht, vetëm për shkak se shumë hulumtues të bërë një supozim të caktuar nuk do të thotë që ju duhet të bëni atë shumë. Por, kjo do të thotë se kur krahasohen mostrat jo-probabilitetit të mostrave probabilitetit në praktikë, ne duhet të mbani në mend se të dyja varen në supozime dhe informacione ndihmëse në mënyrë që të prodhojnë vlerësime. Në mjedise më realiste, thjesht nuk ka qasje supozim pa në konkluzion.

Së fundi, nëse ju kujdeseni për një vlerësim në veçanti-në tonë shembull papunësisë normë, atëherë ju keni nevojë për një gjendje të dobët se homogjene-përgjigje-Prirjeve-brenda-grupeve supozim. Në mënyrë të veçantë, ju nuk keni nevojë të supozojmë se të gjithë kanë të njëjtën prirje përgjigje, ju vetëm duhet të supozojmë se nuk ka korrelacion midis prirje përgjigje dhe norma e papunësisë brenda secilit grup. Natyrisht, edhe ky kusht të dobët nuk do të mbajë në disa situata. Për shembull, imagjinoni vlerësuar përqindjen e amerikanëve që të bëjë punë vullnetare. Nëse njerëzit që bëjnë punë vullnetare kanë më shumë gjasa për të rënë dakord për të qenë në një anketë, atëherë hulumtuesit do sistematikisht mbi-vlerësuar sasinë e vullnetarizmit, edhe në qoftë se ata e bëjnë rregullime pas stratifikimit, një rezultat që është demonstruar në mënyrë empirike nga Abraham, Helms, and Presser (2009) .

Siç thashë më parë, mostra jo-probabilitare shihet me skepticizëm të madh nga shkencëtarët socialë, pjesërisht për shkak të rolit të tyre në disa nga dështimet më të turpshme në ditët e para të hulumtimit të anketës. Një shembull i qartë se sa larg kemi ardhur me mostrat jo-probabilitetit është hulumtimi i Wei Wang, David Rothschild, Sharad Goel, dhe Andrew Gelman se si duhet gjetur rezultatin e zgjedhjeve të 2012 SHBA duke përdorur një kampion jo-probabilitetit të përdoruesve amerikan Xbox -a mostër vendosur jo i rastësishëm i amerikanëve (Wang et al. 2015) . Hulumtuesit rekrutuan të anketuarit nga sistemi i lojrave XBox, dhe si ju mund të presin, mostra Xbox anon mashkull dhe anon ri: 18 - vjeç 29 vjeçare përbëjnë 19% të elektoratit, por 65% të kampionit Xbox dhe njerëzit përbëjnë 47% e elektoratit dhe 93% e kampionit Xbox (Figura 3.4). Për shkak të këtyre paragjykimeve të forta demografike, të dhënat e papërpunuara Xbox ishte një tregues i dobët i kthimit të zgjedhjeve. Ai parashikoi një fitore të fortë për Mitt Romney mbi Barack Obama. Përsëri, kjo është një shembull tjetër për rreziqet e para, mostrat parregulluara jo-probabilitetit dhe të kujton fiasko Literary Digest.

Figura 3.4: Demografia e të anketuarve në Wang et al. (2015) . Për shkak se të anketuarit janë rekrutuar nga XBox, ata kishin më shumë gjasa të jenë të rinj dhe më shumë të ngjarë të jenë meshkuj, relative të votuesve në zgjedhjet e vitit 2012.

Megjithatë, Wang dhe kolegët ishin të vetëdijshëm për këto probleme dhe u përpoq për të peshës të paditurit për të korrigjuar për procesin e marrjes së mostrave. Në veçanti, ata kanë përdorur një formë më të sofistikuar të pas-shtresimit të kam thënë në lidhje. Vlen të mësuar pak më shumë për qasjen e tyre, sepse ajo ndërton intuitë për pas-shtresimit, dhe versioni i veçantë Wang dhe kolegët e përdorur është një nga qasjet më emocionuese në mostrat e matjes së jo-probabilitetit.

Në shembullin tonë të thjeshtë në lidhje me vlerësimin e papunësisë në seksionin 3.4.1, kemi ndarë popullsinë në grupe në bazë të gjendjes së banimit. Në të kundërt, Wang dhe kolegët e ndau popullsinë në në 176,256 grupe të përcaktuara nga: gjinisë (2 kategori), raca (4 kategori), mosha (4 kategori), arsimi (4 kategori), shteti (51 kategori), ID partisë (3 kategoritë), ideologjia (3 kategori), 2008 vota (3 kategori). Me më shumë grupe, studiuesit shpresuar se ajo do të jetë gjithnjë e më shumë gjasa që brenda secilit grup, përgjigjja prirja ishte palidhura me mbështetje për Obamën. Next, dhe jo ndërtimin e peshave të nivelit individual, siç bëmë në shembullin tonë, Wang dhe kolegët e përdorur një model të ndërlikuar për të vlerësuar përqindjen e njerëzve në çdo grup që do të votojnë për Obamën. Së fundi, ata kombinuar këto vlerësime grupit të mbështetjes me madhësinë e njohur e secilit grup për të prodhuar një nivel të vlerësuar përgjithshëm të mbështetjes. Me fjalë të tjera, ata çanë popullsinë në grupe të ndryshme, vlerësoi mbështetjen për Obamën në secilin grup, dhe pastaj mori një mesatare e ponderuar e vlerësimeve të grupit për të prodhuar një vlerësim të përgjithshëm.

Kështu, sfidë e madhe në qasjen e tyre është për të vlerësuar mbështetjen për Obamën në secilin nga këto grupe 176,256. Edhe pse panel tyre përfshihen 345,858 pjesëmarrës unike, një numër të madh nga standardet e votimit të zgjedhjeve, ka pasur shumë, shumë grupe për të cilat Wang dhe kolegët kishin pothuajse asnjë të anketuar. Prandaj, për të vlerësuar mbështetjen në çdo grup ata kanë përdorur një teknikë të quajtur regresionit multilevel me post-shtresim, të cilat studiuesit affectionately quajnë zotin P. Në thelb, për të vlerësuar mbështetjen për Obamën brenda një grupi të caktuar, pishina z P. informacione nga shumë grupeve të lidhura ngushtë. Për shembull, merrni parasysh sfidën e vlerësimit të mbështetjes për Obamën në mesin e hispanikëve femra, midis 18-29 vjeç, të cilët janë diplomuar në kolegj, të cilët janë të regjistruar demokratët, të cilët vetë-identifikohen si të moderuar, dhe që votuan për Obamën në vitin 2008. Kjo është një grup shumë shumë specifike, dhe është e mundur që nuk ka asnjë në mostrën me këto karakteristika. Prandaj, për të bërë vlerësime në lidhje me këtë grup, pishina z P. bashku vlerëson nga njerëzit në grupe shumë të ngjashme.

Duke përdorur këtë strategji analiza, Wang dhe kolegët ishin në gjendje të përdorin mostrën XBox jo-probabilitetit për të vlerësuar nga afër mbështetjen e përgjithshme që Obama ka marrë në zgjedhjet e vitit 2012 (Figura 3.5). Në fakt vlerësimet e tyre ishin më të sakta se një total prej sondazheve të opinionit publik. Kështu, në këtë rast, koeficient-veçanërisht z P.-duket për të bërë një punë të mirë korrigjimin paragjykimet në të dhëna jo të probabilitetit; biases cilat janë në dukje kur ju shikoni në vlerësimet nga të dhënat e parregulluar Xbox.

Figura 3.5: Vlerësimet nga Wang et al. (2015) . Mostra parregulluara XBox prodhuar vlerësime të pasakta. Por, mostra e ponderuar XBox prodhuar vlerësime që ishin më të sakta se një mesatare prej sondazheve telefonike probabilitetit të bazuara.

Ka dy mësime kryesore nga studimi i Wang dhe kolegët. Së pari, të parregulluara mostrat jo-probabilitetit mund të çojnë në vlerësime të këqija; ky është një mësim që shumë hulumtues e kanë dëgjuar më parë. Megjithatë, mësimi i dytë është se mostra jo-probabilitare, kur peshuar si duhet, në fakt mund të prodhojnë vlerësime të mjaft të mira. Në fakt, vlerësimet e tyre ishin më të sakta se vlerësimet nga pollster.com, një bashkimi të sondazheve më tradicionale të zgjedhjeve.

Së fundi, ka kufizime të rëndësishme për atë që ne mund të mësojmë nga ky një studim të veçantë. Vetëm për shkak se post-shtresim ka punuar edhe në këtë rast të veçantë, nuk ka asnjë garanci që ajo do të punojnë edhe në raste të tjera. Në fakt, zgjedhjet janë ndoshta një nga parametrat më të lehta pasi anketuesit kanë studiuar zgjedhjet për gati 100 vjet, nuk ka reagime të rregullt (ne mund të shohim se kush fiton zgjedhjet), dhe identifikimi i partisë dhe karakteristikat demografike janë relativisht parashikuese e votimit. Në këtë pikë, ne nuk kemi teori solide dhe përvoja empirike të dinë kur Pesha rregullimet për mostrat jo-probabilitetit do të prodhojnë vlerësime mjaft të sakta. Një gjë që është e qartë, megjithatë, është në qoftë se ju jeni të detyruar të punojnë me mostrat jo-probabilitetit, atëherë nuk ka arsye të forta për të besuar se vlerësimet e rregulluara do të jetë më mirë se vlerësimet jo-rregulluar.