3.4.1 Varbūtība izlases: datu vākšana un datu analīze

Svaru var atsaukt traucējumus apzināti radītos izlases procesā.

Varbūtība paraugi ir tie, kur visi cilvēki ir zināms, ne-nulles varbūtību iekļaušanu, un vienkāršākais varbūtība izlases dizains ir vienkāršs nejaušās izlases, kur katram cilvēkam ir vienādas varbūtības iekļaušanu. Ja respondenti ir izvēlēti, izmantojot nejaušas izlases ar perfektu izpildi (piemēram, nav pārklājuma kļūdas un nav atbilžu), tad novērtējums ir vienkārša, jo paraugs būs-vidēji-būt miniatūra versija iedzīvotāju.

Vienkāršs izlases izlases reti izmanto praksē, tomēr. Drīzāk, pētnieki apzināti izvēlētos cilvēkus ar nevienlīdzīgiem varbūtībām iekļaušanu, lai samazinātu izmaksas un palielinātu precizitāti. Kad pētnieki apzināti izvēlētos cilvēkus ar dažādām varbūtībām iekļaušanu, tad korekcijas ir nepieciešamas, lai atsauktu traucējumus, ko rada paraugu ņemšanas procesā. Citiem vārdiem sakot, kā mēs vispārināt no izlases atkarīgs izvēlēts paraugs.

Piemēram, pašreizējais iedzīvotāju aptauja (CPS) izmanto ASV valdība, lai novērtētu bezdarba līmeni. Katru mēnesi aptuveni 100000 cilvēku intervēti vai nu sejas-pret-aci vai pa tālruni, un rezultāti tiek izmantoti, lai ražotu aplēsto bezdarba līmeni. Jo valdība vēlas novērtēt bezdarba līmeni katrā valstī, to nevar darīt vienkāršu nejaušu izlasi pieaugušajiem, jo ​​tas varētu dot pārāk maz respondentu valstīs ar mazu iedzīvotāju skaitu (piemēram, Rhode Island), un pārāk daudz no valstīm ar lielu iedzīvotāju skaitu (piemēram, , California). Tā vietā, CPS paraugi cilvēki dažādās valstīs dažādos tempos, procesu, ko sauc stratificētu izlasi ar nevienlīdzīgu varbūtību izvēli. Piemēram, ja CPS gribēju 2000 respondenti par valsti, tad pieaugušie Rhode Island būtu aptuveni 30 reizes lielāku varbūtību iekļaušanu nekā pieaugušie Kalifornijā (Rhode Island: 2000 respondenti uz 800.000 pieaugušajiem vs Kalifornijā: 2000 respondenti uz 30.000.000 pieaugušajiem). Kā mēs redzēsim vēlāk, šāda veida paraugu ņemšanai ar nevienlīdzīgu varbūtību notiek ar tiešsaistes datu avotiem pārāk, bet atšķirībā no SN, izlases mehānisms parasti nav zināma vai kontrolē pētnieks.

Ņemot vērā tās izlases dizainu, SN nav tieši pārstāvis ASV; tas ietver daudz cilvēku no Rodailendas un pārāk maz no Kalifornijas. Tāpēc nebūtu saprātīgi novērtēt bezdarba līmenis valstī bezdarba līmenis paraugā. Tā vietā, lai parauga vidējo, tas ir labāk veikt svērto vidējo, kad svērumi ņemtu vērā faktu, ka cilvēki no Rodailendas biežāk jāiekļauj nekā cilvēki no Kalifornijas. Piemēram, katrs cilvēks no Kalifornijas būtu upweighted- viņi rēķināties vairāk tāmi-un katrai personai no Rodailendas būtu downweighted-tie rēķināties mazāk tāmi. Būtībā, jums tiek dota lielāka balsi cilvēkiem, ka jums ir mazāk ticams, lai uzzinātu par.

Šī rotaļlieta piemērs ilustrē nozīmīgu, bet parasti izprastā punkts: paraugs nav nepieciešams būt miniatūru versiju iedzīvotāju, lai iegūtu labus novērtējumus. Ja pietiekami daudz ir zināms par to, kā tika vākti dati, tad šo informāciju var izmantot, veicot aprēķinus no izlases. Pieeja Esmu tikko aprakstīts, un ka es aprakstīt matemātiski tehniskajā pielikumā, ietilpst squarely ietvaros klasiskā varbūtību izlases ietvaros. Tagad es jums parādīs, kā, ka pati ideja var piemērot bez izlasēm pēc varbūtības.