3.4 Nani kuuliza

Uwezekano sampuli na sampuli zisizo uwezekano ni kwamba tofauti katika mazoezi; katika kesi zote mbili, ni wote kuhusu uzito.

Sampuli ni msingi kwa utafiti utafiti. Watafiti karibu kamwe kuuliza maswali yao kwa kila mtu katika walengwa wao. Katika suala hili, tafiti si ya kipekee. utafiti zaidi, kwa namna moja au nyingine, inahusisha sampuli. Wakati mwingine sampuli hii ni kosa waziwazi na mtafiti; mara nyingine hutokea kabisa. Kwa mfano, mtafiti kwamba anaendesha majaribio ya maabara juu ya wanafunzi wa shahada katika chuo kikuu yake pia kuchukuliwa sampuli. Hivyo, uchaguzi katika utafiti ni tatizo ambalo anakuja juu katika kitabu hiki. Kwa kweli, moja ya wasiwasi ya kawaida kwamba mimi kusikia kuhusu vyanzo digital umri wa data ni "wao si mwakilishi." Kama tutakavyoona katika Sehemu hii, suala hili ni kidogo sana wote na mwerevu kuliko wenye wasiwasi wengi kutambua. Kwa kweli, mimi watasema kuwa dhana nzima ya "representativeness" siyo na manufaa kwa kufikiria juu ya uwezekano na mashirika yasiyo ya uwezekano sampuli. Badala yake, ni muhimu kufikiri kuhusu jinsi data zilikusanywa na jinsi biases yoyote katika ukusanyaji wa takwimu zinaweza kurudishwa tena wakati wa kufanya makadirio.

Hivi sasa, kubwa kinadharia mkabala na uwakilishi ni uwezekano sampuli. Wakati data zinakusanywa na uwezekano sampuli mbinu ambayo imekuwa kikamilifu kunyongwa, watafiti ni uwezo wa uzito data zao kwa kuzingatia njia ambayo wao zilikusanywa kufanya makadirio unbiased kuhusu walengwa. Hata hivyo, kamili ya uwezekano sampuli kimsingi kamwe kinatokea katika ulimwengu wa kweli. Kuna kawaida matatizo mawili makubwa 1) tofauti kati ya walengwa na idadi ya watu sura na 2) majibu yasiyo (hizi ni hasa matatizo ambayo wamesababisha uchaguzi Fasihi Digest). Hivyo, badala ya kufikiri ya uwezekano sampuli kama mfano halisi ya nini hasa kinachotokea katika ulimwengu, ni bora kufikiria uwezekano sampuli kama msaada, abstract mfano, kiasi kama njia ya wanafizikia hudhani kuhusu mpira frictionless rolling chini kubwa kwa muda mrefu njia panda.

Mbadala kwa uwezekano sampuli ni mashirika yasiyo ya uwezekano sampuli. Tofauti kubwa kati ya uwezekano na mashirika yasiyo ya uwezekano sampuli ni kwamba pamoja na uwezekano sampuli kila mtu katika idadi ya watu ina uwezekano inayojulikana ya ushirikishwaji. Kuna, kwa kweli, aina nyingi za zisizo uwezekano sampuli, na njia hizi za ukusanyaji wa takwimu ni inazidi kuwa ya kawaida katika umri digital. Lakini, mashirika yasiyo ya uwezekano sampuli ina sifa ya kutisha kati ya wanasayansi ya kijamii na wanatakwimu. Kwa kweli, mashirika yasiyo ya uwezekano sampuli ni kuhusishwa na baadhi ya kushindwa makubwa zaidi ya watafiti utafiti, kama vile fasihi Digest fiasco (kujadiliwa mapema) na utabiri sahihi kuhusu Marekani uchaguzi wa rais wa 1948 ( "Dewey kushindwa Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Hata hivyo, wakati ni haki ya kufikiria upya zisizo uwezekano sampuli kwa sababu mbili. Kwanza, kama uwezekano sampuli imeendelea kuwa vigumu kufanya katika mazoezi, mstari kati ya sampuli uwezekano na sampuli zisizo uwezekano ni blurring. Wakati kuna viwango vya juu vya majibu yasiyo (kama kuna katika tafiti halisi sasa), uwezekano halisi ya inclusions kwa waliohojiwa hawajulikani, na hivyo, sampuli uwezekano na sampuli zisizo uwezekano si kama tofauti kama watafiti wengi wanaamini. Kwa kweli, kama tutaona chini, mbinu zote mbili kimsingi kutegemea kukadiria utaratibu huo: baada ya stratification. Pili, kumekuwa na maendeleo mengi katika ukusanyaji na uchambuzi wa sampuli zisizo uwezekano. Mbinu hizi ni tofauti kutosha kutokana na mbinu kwamba unasababishwa matatizo katika siku za nyuma kwamba nadhani ni mantiki ya kufikiri wao kama "yasiyo ya uwezekano sampuli 2.0." Hatupaswi kuwa na chuki irrational kwa njia zisizo uwezekano kwa sababu ya makosa yaliyotokea muda mrefu uliopita.

Next, ili kufanya hoja hii thabiti zaidi, mimi itabidi kupitia kiwango cha uwezekano sampuli na Viktning (Sehemu ya 3.4.1). wazo muhimu ni kwamba jinsi zilizokusanywa data yako inavyoweza kuathiri jinsi gani kufanya makadirio. Hasa, kama kila mtu hana uwezekano huo wa ushirikishwaji, basi kila mmoja anapaswa kuwa na uzito sawa. Kwa maneno mengine, kama sampuli yako si ya kidemokrasia, basi makadirio yako lazima kuwa wa kidemokrasia. Baada ya kutazama Viktning, mimi itabidi kuelezea njia mbili kwa zisizo uwezekano sampuli: moja ambayo inalenga katika Viktning ili kukabiliana na tatizo la data mpangilio zilizokusanywa (Sehemu ya 3.4.2), na moja ambayo hujaribu kufanya zaidi udhibiti wa jinsi data ni zilizokusanywa (sehemu ya 3.4.3). hoja katika maandishi kuu utaelezwa chini kwa maneno na picha; wasomaji ambao wangependa matibabu zaidi hisabati lazima pia angalia kiambatanisho kiufundi.