3.4 Kas uzdot

Varbūtība paraugi un nav varbūtība paraugi nav, ka dažādas praksē; abos gadījumos, tas viss ir par svaru.

Paraugu ņemšana ir būtiska domas izpēti. Pētnieki gandrīz nekad uzdot savus jautājumus visiem to mērķa populācijā. Šajā sakarā aptaujas nav unikāla. Lielākā daļa pētījumu, vienā vai otrā veidā, ietver paraugu ņemšanu. Dažreiz tas Atlasi veic skaidri pētniekam; citreiz tas notiek netieši. Piemēram, pētnieks, kas vada laboratorijas eksperimentu studējošiem studentiem viņas universitātē ir arī veikusi paraugu. Tādējādi, paraugu ņemšana ir problēma, kas nāk klajā visā šajā grāmatā. Patiesībā, viens no visbiežāk bažām, ka es dzirdu par digitālajā laikmetā datu avotiem ir "tie nav reprezentatīvi." Kā mēs redzēsim šajā iedaļā, šīs bažas ir gan mazāk nopietns un smalkāks nekā daudzi skeptiķi realizēt. Patiesībā, es apgalvot, ka visa koncepcija "pārstāvības" nav noderīga domāt par varbūtības un bez izlasēm pēc varbūtības. Tā vietā, galvenais ir domāt par to, kā dati tika vākti un kā jebkuri aizspriedumi šajā datu vākšanas, var atsaukt, veicot aprēķinus.

Pašlaik dominējošais teorētiskā pieeja pārstāvība ir varbūtība izlases. Kad dati tiek vākti ar varbūtību izlases metodi, kas ir pilnīgi izpildīts, pētnieki spēj svara savus datus, pamatojoties uz to, kā tie tika vākti, lai padarītu objektīvus aprēķinus par mērķa populācijā. Taču ideāls varbūtības izlases būtībā nekad notiek reālajā pasaulē. Tur parasti ir divas galvenās problēmas 1) atšķirības starp mērķa iedzīvotājiem un rāmja iedzīvotājiem un 2) nav atbildes (tās ir tieši tās problēmas, kas sabojātas literārā Digest aptauju). Tātad, nevis domāt par izlasi pēc varbūtības kā reālu modeli, kas patiesībā notiek šajā pasaulē, tas ir labāk domāt par izlasi pēc varbūtības par noderīgu, teorētisko modeli, daudz, patīk, kā fiziķi domā par to raitu bumbu slīdošo nosaka bezgalīgi ilgi rampas.

Alternatīva izlasi pēc varbūtības ir ne-varbūtību izlases. Galvenā atšķirība starp iespējamību un nav varbūtības izlase ir tā, ka ar varbūtību paraugus ikvienam iedzīvotājiem ir zināms varbūtība iekļaušanu. Ir, patiesībā, daudz šķirņu, kas nav varbūtības izlase, un šīs datu vākšanas metodes kļūst arvien izplatītāka digitālajā laikmetā. Bet, non-varbūtību izlases ir briesmīga reputācija starp sociālajiem zinātniekiem un statistiķi. Patiesībā, non-varbūtību izlases ir saistīta ar kādu no dramatiskākajām neveiksmes apsekojumu pētniekiem, piemēram, Literatūras Digest fiasko (minēts iepriekš), un nepareizā prognozes par ASV prezidenta vēlēšanām 1948. gada ( "Dewey Uzvar Trūmena") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Tomēr, ir īstais laiks pārskatīt nav varbūtības izlases divu iemeslu dēļ. Pirmkārt, kā varbūtības izlases kļūst arvien grūtāk izdarīt praktiski, līnija starp izlasēm pēc varbūtības un nav varbūtības paraugu saplūdušas. Ja ir augsts likmes nerespondences (jo ir reālā aptaujās tagad), faktiskais varbūtība ieslēgumu respondentiem nav zināmi, un tādējādi, varbūtības paraugi un nav varbūtība paraugus nav tik atšķirīgi, jo daudzi pētnieki uzskata. Patiesībā, kā mēs redzēsim tālāk, abas pieejas pamatā balstās uz to pašu novērtēšanas metodi: pēc stratifikācijas. Otrkārt, ir bijuši daudzi attīstība vākšanu un analīzi, kas nav varbūtības paraugus. Šīs metodes ir pietiekami atšķiras no metodēm, kas izraisa problēmas pagātnē, ka es domāju, ka tas ir jēga domāt par to, kā "non-izlasi pēc varbūtības 2.0." Mums nevajadzētu būt neracionālu nepatiku pret ārpus varbūtību metodēm, jo ​​kļūdas, kas notika sen.

Tālāk, lai padarītu šo argumentu konkrētākas, es ņemšu pārskatīt standarta izlasi pēc varbūtības un korekcijas (3.4.1). Galvenā ideja ir tāda, ka, kā jūs savākti savus datus vajadzētu ietekmēt to, kā jūs veikt aprēķinus. Jo īpaši, ja visi nav vienāda iespēja iekļaušanu, tad visi nedrīkst būt vienāda nozīme. Citiem vārdiem sakot, ja jūsu izlases nav demokrātiska, tad jūsu aplēses nebūtu demokrātiska. Pārskatot koeficientu, es ņemšu aprakstīt divas pieejas, kas nav varbūtības izlase: vienu, kas vērsta uz koeficientu, lai risinātu problēmu haphazardly savākto datu (3.4.2 iedaļu), un vienu, kas mēģina izvietot lielāku kontroli pār to, kā dati ir savākti (3.4.3 iedaļu). Ar pamattekstā argumenti tiks paskaidrots turpmāk ar vārdiem un attēliem; lasītāji, kuri vēlas vairāk matemātisko apstrādi vajadzētu redzēt arī tehnisko pielikumu.