3.4.2 Non-uwezekano sampuli: Viktning

Na sampuli zisizo uwezekano, uzito anaweza kuondoa uharibifu unaosababishwa na kudhani sampuli mchakato.

Katika njia sawa kwamba watafiti uzito majibu kutoka sampuli uwezekano, wanaweza pia uzito majibu kutoka sampuli zisizo uwezekano. Kwa mfano, kama njia mbadala ya CPS, kufikiria kwamba wewe kuwekwa matangazo bendera juu ya maelfu ya Nje kuwaajiri washiriki kwa ajili ya utafiti kukadiria kiwango cha ukosefu wa ajira. Kwa kawaida, ungependa kuwa na wasiwasi kuwa rahisi maana ya sampuli yako itakuwa makisio nzuri ya kiwango cha ukosefu wa ajira. wasiwasi yako pengine ni kwa sababu unafikiri kwamba baadhi ya watu ni zaidi ya kukamilisha utafiti wako kuliko wengine. Kwa mfano, watu ambao hawana kutumia muda mwingi kwenye mtandao ni chini ya uwezekano wa kukamilisha utafiti wako.

Kama tulivyoona katika sehemu ya mwisho, hata hivyo, kama sisi kujua jinsi sampuli alichaguliwa-kama sisi kufanya na uwezekano sampuli-basi tunaweza tengua uharibifu unaosababishwa na mchakato sampuli. Kwa bahati mbaya, wakati wa kufanya kazi na sampuli zisizo uwezekano, hatujui jinsi sampuli alichaguliwa. Lakini, tunaweza kufanya mawazo kuhusu mchakato sampuli na kisha kuomba Viktning kwa njia sawa. Kama dhana hizi ni sahihi, basi Viktning ataondoa uharibifu unaosababishwa na mchakato sampuli.

Kwa mfano, fikiria kuwa katika kukabiliana na matangazo yako bendera, wewe kuajiri 100,000 washiriki. Hata hivyo, huna kuamini kwamba hizi waliohojiwa 100,000 ni rahisi random sampuli ya watu wazima Marekani. Kwa kweli, wakati kulinganisha waliohojiwa yako kwa idadi ya Marekani, unakuta kwamba watu kutoka baadhi ya mataifa (kwa mfano, New York) ni watu juu-kuwakilishwa na kwamba kutoka baadhi ya majimbo (kwa mfano, Alaska) hawana uwakilishi. Hivyo, kiwango cha ukosefu wa sampuli yako ni uwezekano wa kuwa makisio mbaya ya kiwango cha ukosefu wa ajira katika walengwa.

Moja ya njia ya tengua kuvuruga yaliyotokea katika mchakato sampuli ni hawawajui uzito kwa kila mtu; uzito chini ya watu kutoka nchi ambazo ni juu-kuwakilishwa katika sampuli (kwa mfano, New York) na uzito juu ya watu kutoka nchi ambazo ni uwakilishi wa kutosha katika sampuli (kwa mfano, Alaska). Zaidi hasa, uzito kwa kila mhojiwa ni kuhusiana na kiwango cha maambukizi yao katika sampuli jamaa yako na kiwango cha maambukizi yao katika idadi ya Marekani. Utaratibu huu Viktning inaitwa baada ya stratification, na wazo la uzito lazima kuwakumbusha ya mfano katika Sehemu ya 3.4.1 ambapo waliohojiwa kutoka Rhode Island walipewa chini ya uzito kuliko waliohojiwa kutoka California. Post-stratification inahitaji kwamba unajua kutosha kuweka waliohojiwa wako katika makundi na kujua idadi ya watu lengo katika kila kundi.

Ingawa Viktning ya sampuli uwezekano na ya sampuli zisizo uwezekano ni hesabu hiyo (angalia kiambatanisho kiufundi), wanafanya kazi vizuri katika hali tofauti. Kama mtafiti ina kamili uwezekano sampuli (yaani, hakuna kosa chanjo na hakuna majibu yasiyo), kisha Viktning kuzalisha makadirio unbiased kwa sifa zote katika kesi zote. Hii kali kinadharia kuhakikisha ni kwa nini mawakili wa sampuli uwezekano kupata yao ili kuvutia. Kwa upande mwingine, Viktning sampuli zisizo uwezekano tu kuzalisha makadirio unbiased kwa sifa zote kama majibu propensities ni sawa kwa kila mtu katika kila kundi. Kwa maneno mengine, kufikiri nyuma kwa mfano wetu, kwa kutumia baada ya stratification kuzalisha makadirio unbiased kama kila mtu katika New York ina uwezekano huo wa zinazoshiriki na kila mtu katika Alaska ina uwezekano huo wa zinazoshiriki na kadhalika. Dhana hii inaitwa homogeneous-jibu-propensities-ndani-makundi dhana, na ina jukumu muhimu katika kujua kama baada ya stratification kazi vizuri na sampuli zisizo uwezekano.

Kwa bahati mbaya, katika mfano wetu, homogeneous-jibu-propensities-ndani-makundi dhana inaonekana uwezekano kuwa ni kweli. Yaani, inaonekana uwezekano kwamba kila mtu katika Alaska ina uwezekano huo wa kuwa katika utafiti wako. Lakini, kuna pointi tatu muhimu kukumbuka kuhusu baada ya stratification, ambayo yote kufanya hivyo kuonekana zaidi kuahidi.

Kwanza, homogeneous-jibu-propensities-ndani-makundi dhana inakuwa zaidi plausible kama idadi ya makundi huongezeka. Na, watafiti si mdogo na makundi tu kwa kuzingatia single mwelekeo kijiografia. Kwa mfano, tunaweza kuunda vikundi msingi serikali, umri, jinsia, na kiwango cha elimu. Inaonekana zaidi plausible kwamba kuna homogeneous majibu propensities ndani ya kundi la 18-29, wahitimu wa kike, chuo wanaoishi katika Alaska kuliko ndani ya kundi la watu wote wanaoishi katika Alaska. Hivyo, kama idadi ya vikundi kutumika kwa ajili ya ongezeko baada ya stratification, mawazo zinahitajika ili kusaidia yake kuwa zaidi ya busara. Kutokana na ukweli huu, inaonekana kama watafiti wanataka kujenga idadi kubwa ya makundi kwa baada ya stratification. Lakini, kama idadi ya makundi kuongezeka, watafiti kukimbia katika tatizo tofauti: data sparsity. Kama kuna idadi ndogo tu ya watu katika kila kundi, basi makadirio itakuwa zaidi uhakika, na katika kesi uliokithiri ambapo kuna kundi ambalo halina waliohojiwa, basi baada ya stratification kabisa umekwisha. Kuna njia mbili nje ya mvutano huu wa asili kati ya plausibility ya homogeneous- majibu-propensity-ndani-makundi dhana na mahitaji ya ukubwa busara sampuli katika kila kundi. Njia moja ni kwa hoja ya mfano wa kuigwa kisasa zaidi takwimu kwa ajili ya kuhesabu uzito na wengine ni kukusanya kubwa, zaidi tofauti sampuli, ambayo husaidia kuhakikisha ukubwa busara sampuli katika kila kundi. Na, wakati mwingine watafiti kufanya zote mbili, kama mimi itabidi kuelezea kwa undani zaidi hapa chini.

kuzingatia pili wakati wa kufanya kazi na baada ya stratification kutoka sampuli zisizo uwezekano ni kwamba homogeneous-jibu-propensity-ndani-makundi dhana tayari mara nyingi alifanya wakati kuchambua sampuli uwezekano. sababu ya kuwa dhana hii ni zinahitajika kwa ajili ya sampuli uwezekano katika mazoezi ni kwamba uwezekano sampuli na majibu yasiyo na njia ya kawaida kwa ajili ya kurekebisha kwa majibu yasiyo ni baada ya stratification kama ilivyoelezwa hapo juu. Bila shaka, kwa sababu tu watafiti wengi kufanya dhana fulani haina maana kwamba unapaswa kufanya hivyo pia. Lakini, haina maana kwamba wakati kulinganisha sampuli zisizo uwezekano wa sampuli uwezekano katika mazoezi, ni lazima kukumbuka kwamba wote wanategemea mawazo na habari msaidizi ili kuzalisha makadirio. Katika mazingira kweli wengi, kuna tu hakuna mbinu dhana-bure kwa jinsi anavyojua.

Hatimaye, kama huduma ya juu moja makisio hasa katika yetu mfano ukosefu wa ajira kiwango-basi unahitaji hali dhaifu kuliko homogeneous-jibu-propensity-ndani-makundi dhana. Hasa, huna haja ya kudhani kwamba kila mtu ana sawa majibu propensity, wewe tu haja ya kudhani kwamba hakuna uwiano kati ya majibu propensity na cha ukosefu wa ajira ya kila kundi. Bila shaka, hata hali hii nguvu si kushikilia katika baadhi ya hali. Kwa mfano, fikiria kukadiria uwiano wa Wamarekani kwamba kufanya kazi ya kujitolea. Kama watu wanaofanya kazi ya kujitolea ni zaidi ya kukubali kuwa katika utafiti huo, kisha watafiti mapenzi kwa utaratibu juu-makisio ya kiasi cha kujitolea, hata kama kufanya marekebisho baada ya stratification, matokeo yake ni kwamba imekuwa imeonesha empirically na Abraham, Helms, and Presser (2009) .

Kama nilivyosema awali, sampuli zisizo uwezekano ni kutazamwa na wasiwasi mkubwa na wanasayansi ya jamii, katika sehemu kwa sababu ya wajibu wao katika baadhi ya kushindwa aibu zaidi katika siku za mwanzo za utafiti utafiti. mfano wa wazi wa jinsi mbali tumefika na sampuli zisizo uwezekano ni utafiti wa Wei Wang, David Rothschild, Sharad Goel, na Andrew Gelman kwamba usahihi zinalipwa matokeo ya uchaguzi wa 2012 Marekani kutumia yasiyo ya uwezekano sampuli ya watumiaji wa Marekani Xbox -a wameamua yasiyo ya random sampuli ya Wamarekani (Wang et al. 2015) . watafiti kuajiri waliohojiwa kutoka XBox michezo ya kubahatisha mfumo, na kama unaweza kutarajia, Xbox sampuli umekiuka kiume na umekiuka vijana: 18-29 mwaka Olds kufanya juu 19% ya wapiga kura lakini 65% ya Xbox sampuli na wanaume kufanya juu 47% ya wapiga kura na 93% ya Xbox sampuli (Kielelezo 3.4). Kwa sababu ya haya biases nguvu za idadi ya watu, mbichi Xbox data mara kiashiria maskini ya anarudi uchaguzi. Ni alitabiri ushindi nguvu kwa ajili ya Mitt Romney juu ya Barack Obama. Tena, hii ni mfano mwingine wa hatari za mbichi, unadjusted sampuli zisizo uwezekano na ni kukumbusha ya Fasihi Digest fiasco.

Kielelezo 3.4: Demographics ya washiriki katika Wang et al. (2015). Kwa sababu waliohojiwa walikuwa kuajiri kutoka XBox, walikuwa zaidi uwezekano wa kuwa vijana na zaidi ya kuwa kiume, jamaa na wapiga kura katika uchaguzi wa 2012.

Kielelezo 3.4: Demographics ya washiriki katika Wang et al. (2015) . Kwa sababu waliohojiwa walikuwa kuajiri kutoka XBox, walikuwa zaidi uwezekano wa kuwa vijana na zaidi ya kuwa kiume, jamaa na wapiga kura katika uchaguzi wa 2012.

Hata hivyo, Wang na wenzake walikuwa na ufahamu wa matatizo haya na alijaribu uzito waliohojiwa kusahihisha kwa ajili ya mchakato sampuli. Hasa, walitumia aina ya kisasa zaidi ya baada ya stratification niliyowaelezea. Ni thamani ya kujifunza kidogo zaidi kuhusu mbinu zao kwa sababu hujenga Intuition kuhusu baada ya stratification, na hasa version Wang na wenzake kutumika ni moja ya mbinu ya kusisimua zaidi Viktning sampuli zisizo uwezekano.

Katika mfano wetu rahisi kuhusu kukadiria ukosefu wa ajira katika Sehemu ya 3.4.1, sisi kugawanywa idadi ya watu katika makundi kulingana na hali ya makazi. Kwa upande mwingine, Wang na wenzake kugawanywa idadi ya watu katika katika makundi 176,256 inavyoelezwa na: jinsia (2 makundi), mbio (4 makundi), umri (4 makundi), Elimu (4 makundi), hali (51 makundi), ID chama (3 makundi), itikadi (3 makundi) na 2008 kura (3 makundi). Na makundi zaidi, watafiti na matumaini kwamba itakuwa inazidi uwezekano kwamba ndani ya kila kikundi, majibu propensity mara uncorrelated na msaada kwa Obama. Pili, badala ya kujenga uzito wa mtu binafsi ngazi ya juu, kama tulivyofanya katika mfano wetu, Wang na wenzake kutumika mfano tata kukadiria idadi ya watu katika kila kundi kwamba ingekuwa kupiga kura kwa Obama. Hatimaye, wao pamoja makadirio haya kundi la msaada kwa ukubwa inayojulikana ya kila kundi kutoa makadirio kiwango cha jumla ya msaada. Kwa maneno mengine, wao kung'olewa up idadi ya watu katika makundi mbalimbali, inakadiriwa msaada kwa ajili ya Obama katika kila kundi, na kisha alichukua wastani wa mizigo ya makadirio kundi kutoa makisio kwa ujumla.

Hivyo, changamoto kubwa katika mbinu zao ni kukadiria msaada kwa ajili ya Obama katika kila moja ya makundi haya 176,256. Ingawa jopo yao ni pamoja na 345,858 washiriki kipekee, idadi kubwa na viwango vya kupigia kura za uchaguzi, kulikuwa na watu wengi, makundi mengi ambayo Wang na wenzake alikuwa karibu hakuna washiriki. Kwa hiyo, ili kukadiria msaada katika kila kundi walitumia mbinu ya kuitwa multilevel regression na baada ya stratification, ambayo watafiti affectionately kuwaita Mheshimiwa P. Kimsingi, kukadiria msaada kwa ajili ya Obama ndani ya kundi maalum, Mheshimiwa P. mabwawa maelezo kutoka kwa watu wengi karibu kuhusiana vikundi. Kwa mfano, fikiria changamoto ya kukadiria msaada kwa ajili ya Obama miongoni mwa wanawake, Hispanics, kati ya umri wa miaka 18-29, ambao ni wahitimu wa chuo, ambao wamejiandikisha chama cha Democratic, ambaye binafsi kutambua kama msimamo wa wastani, na ambao walipiga kura kwa Obama mwaka 2008. Hii ni kundi sana, maalum sana, na inawezekana kwamba hakuna mtu katika sampuli na sifa hizo. Kwa hiyo, ili kufanya makadirio kuhusu kundi hili, Mheshimiwa P. mabwawa pamoja inakadiria kutoka kwa watu katika makundi sawa sana.

Kutumia mkakati huu uchambuzi, Wang na wenzake walikuwa na uwezo wa kutumia XBox zisizo uwezekano sampuli kukadiria kwa karibu sana msaada wa jumla kwamba Obama kupokea katika uchaguzi wa 2012 (Kielelezo 3.5). Kwa kweli makadirio yao yalikuwa sahihi zaidi kuliko jumla ya mabao ya kura za maoni ya umma. Hivyo, katika kesi hii, Viktning-hasa Mheshimiwa P.-inaonekana kufanya kazi nzuri ya kurekebisha biases katika data zisizo uwezekano; biases kwamba ni wazi wakati ukiangalia makadirio kutoka data unadjusted Xbox.

Kielelezo 3.5: Makadirio kutoka Wang et al. (2015). Unadjusted XBox sampuli zinazozalishwa makadirio sahihi. Lakini, mizigo XBox sampuli zinazozalishwa makadirio ya kwamba walikuwa sahihi zaidi kuliko wastani wa uwezekano makao tafiti simu.

Kielelezo 3.5: Makadirio kutoka Wang et al. (2015) . Unadjusted XBox sampuli zinazozalishwa makadirio sahihi. Lakini, mizigo XBox sampuli zinazozalishwa makadirio ya kwamba walikuwa sahihi zaidi kuliko wastani wa uwezekano makao tafiti simu.

Kuna mambo mawili kuu kutoka utafiti wa Wang na wenzake. Kwanza, unadjusted sampuli zisizo uwezekano inaweza kusababisha makadirio mbaya; hili ni somo kwamba watafiti wengi wamesikia kabla. Hata hivyo, somo la pili ni kwamba mashirika yasiyo ya uwezekano sampuli, wakati mizigo vizuri, unaweza kweli kuzalisha makadirio nzuri kabisa. Kwa kweli, makadirio yao yalikuwa sahihi zaidi kuliko makadirio kutoka pollster.com, mkusanyiko wa kura za zaidi ya jadi ya uchaguzi.

Hatimaye, kuna mapungufu muhimu kile tunachoweza kujifunza kutokana na utafiti huu mmoja maalum. Kwa sababu tu baada ya stratification kazi vizuri katika kesi hii, hakuna uhakika kwamba itakuwa kazi vizuri katika kesi nyingine. Kwa kweli, uchaguzi ni labda moja ya mazingira rahisi kwa sababu pollsters wamekuwa kusoma uchaguzi kwa karibu miaka 100, kuna mara kwa mara maoni (tunaweza kuona nani atashinda uchaguzi), na kitambulisho chama na sifa za idadi ya watu ni kiasi uingizaji wa kupiga kura. Katika hatua hii, sisi kukosa nadharia imara na uzoefu wa kisayansi kujua wakati Viktning marekebisho ya sampuli zisizo uwezekano kuzalisha makadirio kutosha sahihi. Jambo moja kwamba ni wazi, hata hivyo, ni kama wewe ni kulazimishwa kufanya kazi na sampuli zisizo uwezekano, basi kuna sababu nguvu kuamini kwamba makadirio kurekebishwa itakuwa bora kuliko makadirio zisizo kubadilishwa.