3.4.2 Non-varbūtība paraugi: svēršanas

Šis tulkojums tika izveidota ar datoru. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Non-varbūtība paraugi: svēršanas

Ar ne-izlasēm pēc varbūtības, svars var atsaukt traucējumus, ko rada pieņemto paraugu ņemšanas procesā.

Tādā pašā veidā, ka pētnieki svars atbildes no izlasēm pēc varbūtības, viņi var arī svara atbildes no non-izlasēm pēc varbūtības. Piemēram, kā alternatīvu SN, iedomājieties, ka jūs likts banner reklāmas tūkstošiem tīmekļa vietnes, lai darbā dalībniekus ar apsekojumu, lai novērtētu bezdarba līmenis. Protams, jūs varētu būt skeptiski, ka vienkāršs vidējais jūsu paraugam būtu labs novērtējums bezdarba līmeni. Jūsu skepticisms, iespējams, tāpēc, ka jūs domājat, ka daži cilvēki ir vairāk iespējams, lai pabeigtu savu aptauju nekā citi. Piemēram, cilvēki, kas nav tērēt daudz laika tīmeklī ir mazāka iespēja, lai pabeigtu savu aptauju.

Kā mēs redzējām pēdējā sadaļā, tomēr, ja mēs zinām, kā paraugs tika izvēlēts, kā mēs to darām ar izlasēm pēc varbūtības-tad mēs varam atsaukt traucējumus, ko rada paraugu ņemšanas procesā. Diemžēl, strādājot ar ne-izlasēm pēc varbūtības, mēs nezinām, kā tika izvēlēts paraugs. Bet mēs varam izdarīt pieņēmumus par atlases procesu un pēc tam piemēro koeficientu tādā pašā veidā. Ja šie pieņēmumi ir pareizi, tad svērumu atsaukt izkropļojumus, ko rada paraugu ņemšanas procesā.

Piemēram, iedomājieties, ka, atbildot uz jūsu banner reklāmas, jūs darbā 100000 respondenti. Taču jūs nedomāju, ka šie 100000 respondenti ir vienkāršs izlases paraugu amerikāņu pieaugušajiem. Patiesībā, ja jūs salīdzināt savus respondentus ASV iedzīvotājiem, jūs atradīsiet, ka cilvēki no dažām valstīm (piemēram, New York) ir pārstāvēti un ka cilvēki no dažām valstīm (piemēram, Aļaskas), ir nepietiekami pārstāvētas. Tādējādi bezdarba līmenis jūsu parauga, iespējams, ir slikta aplēse bezdarba līmenis mērķa populācijā.

Viens veids, kā atsaukt traucējumus, kas notika šajā atlases procesā ir piešķirt svarus katrai personai; zemākas svaru cilvēkiem no valstīm, kas pārstāvēti paraugā (piemēram, New York), un augstāku svaru cilvēkiem no valstīm, kas ir nepietiekami pārstāvētas izlasē (piemēram, Alaska). Precīzāk, svars katram respondentam ir saistīta ar to izplatību savā paraugu attiecībā uz to izplatību ASV iedzīvotājiem. Šo procentuālo procedūra tiek saukta pēc noslāņošanās, un doma par svēršanu vajadzētu atgādināt par piemēru 3.4.1 iedaļu, kurā respondenti no Rodailendas tika piešķirta mazāka nozīme nekā respondenti no Kalifornijas. Post-stratifikācijas paredz, ka jūs zināt pietiekami daudz, lai jūsu respondentus grupās un zināt īpatsvaru mērķa populācijas katrā grupā.

Kaut svērums varbūtības parauga un nav varbūtības izlases ir tāda pati matemātiski (skatīt tehnisko pielikumu), viņi strādā arī dažādās situācijās. Ja pētnieks ir ideāls varbūtības paraugu (ti, nav pārklājuma kļūdas un neviens nav reakcijas), tad svēršana ražos objektīvus aprēķinus par visām pazīmēm visos gadījumos. Šī spēcīgs teorētiskais garantija Tāpēc aizstāvji izlasēm pēc varbūtības atrast tos tik pievilcīgs. No otras puses, korekcijas nav varbūtības izlases ražos tikai objektīvus aprēķinus par visām pazīmēm, ja atbildes tieksmes ir vienādi visiem katrā grupā. Citiem vārdiem sakot, domāšana atpakaļ uz mūsu piemērā, izmantojot post-noslāņošanos ražos objektīvus aprēķinus, ja ikviens Ņujorkā ir tāda pati varbūtība piedalīties un ikvienam Aļaskā ir vienāda iespēja piedalīties un tā tālāk. Šis pieņēmums ir sauc par viendabīgu-atbildes-tieksmes-rādiusā grupām pieņēmumu, un tai ir būtiska nozīme, zinot, ja pēc noslāņošanās strādās arī ar ne-izlasēm pēc varbūtības.

Diemžēl, mūsu piemērā, pieņēmums viendabīga-atbildes-tieksmes-laikā-grupās, šķiet maz ticams, lai būtu patiesība. Tas ir, šķiet maz ticams, ka ikvienam Aļaskā ir tāda pati varbūtība, ka jūsu aptaujā. Bet, ir trīs svarīgi punkti, kas jāpatur prātā, par pēc-stratifikācijas, kas visi padara to, šķiet, vairāk daudzsološs.

Pirmkārt, pieņēmums viendabīgs-atbildes-tieksmes-laikā-grupās kļūst ticams, jo grupu skaitu palielinās. Un, pētnieki ir ne tikai grupām, tikai balstoties uz vienu ģeogrāfisko dimensiju. Piemēram, mēs varētu izveidot grupas, pamatojoties uz stāvokli, vecuma, dzimuma, un izglītības līmeni. Šķiet, vairāk ticams, ka nav viendabīgi atbildes tieksmes grupā 18-29 ietvaros, sieviete, koledžas absolventi dzīvo Aļaskā nekā grupā visiem cilvēkiem, kas dzīvo Aļaskā laikā. Tādējādi, kā to grupu skaits, ko izmanto pēc stratifikācijas palielinās, pieņēmumi nepieciešami, lai atbalstītu tā kļūtu saprātīgs. Ņemot vērā šo faktu, šķiet, piemēram, pētnieki vēlētos izveidot lielu skaitu grupām pēc stratifikācijas. Bet, kā grupu skaits palielinās, pētnieki uzskriet citā problēma: datu sparsity. Ja ir tikai neliels cilvēku skaits katrā grupā, tad aprēķini būs neskaidra, un galējā gadījumā, ja ir grupa, kas nav respondenti, tad pēc stratifikācijas pilnīgi izjūk. Ir divi veidi, kā no šā raksturīgo spriedzi starp ticamību homogeneous- pieņēmumu atbilde-tieksme-ietvaros-grupas un pieprasījumu pēc saprātīgām paraugu lielumu katrā grupā. Viena pieeja ir pāriet uz sarežģītākas statistikas modeļa aprēķināšanai svaru un otrs ir savākt lielāku, daudzveidīgāku izlasi, kas palīdz nodrošināt saprātīgas paraugu skaitu katrā grupā. Un dažreiz pētnieki darīt gan, kā es aprakstīt sīkāk.

Otrs apsvērums, strādājot ar post-stratifikāciju no ārpus izlasēm pēc varbūtības, ka pieņēmums, viendabīga-atbilde-tieksme-laikā-grupās ir jau bieži veikts, analizējot varbūtību paraugus. Iemesls, ka šis pieņēmums ir nepieciešams izlasēm pēc varbūtības praksē ir tā, ka varbūtība paraugiem ir ne-atbildes, un visbiežāk metode koriģēšanas atbilžu ir post-noslāņošanās, kā aprakstīts iepriekš. Protams, tikai tāpēc, ka daudzi zinātnieki veikt noteiktu pieņēmums, nenozīmē, ka jums vajadzētu darīt to too. Bet, tas nozīmē, ka, salīdzinot nav varbūtības paraugus izlasēm pēc varbūtības praksē, mums ir jāpatur prātā, ka gan atkarīga no pieņēmumiem un papildu informāciju, lai iegūtu aplēses. Lielākajā reāliem iestatījumiem, vienkārši nav pieņēmums bez pieeja secinājumu.

Visbeidzot, ja jums rūp viens tāmi īpaši, mūsu piemērs bezdarba līmeņa-tad jums ir nepieciešams nosacījums vājāku nekā viendabīgi-atbildes-tieksme-laikā-grupas pieņēmumu. Konkrēti, jums nav nepieciešams pieņemt, ka ikvienam ir pašu atbildi tieksmi, jums tikai nepieciešams pieņemt, ka nepastāv korelācija starp reakcijas tieksmi un bezdarba līmeni katrā grupā. Protams, arī šis vājāka nosacījums netiks turēt dažās situācijās. Piemēram, iedomājieties, novērtējot proporciju amerikāņi, kas darīt brīvprātīgo darbu. Ja cilvēki, kuri brīvprātīgo darbu, visticamāk, piekrīt būt aptaujā, tad pētnieki sistemātiski pārāk aplēstu brīvprātīgo darbu, pat ja tie pēc stratifikācijas korekcijas, rezultātu, kas ir pierādīts empīriski ar Abraham, Helms, and Presser (2009) .

Kā jau teicu iepriekš, non-varbūtība paraugi tiek skatīti ar lielu skepsi sociālie zinātnieki, daļēji tāpēc, ka savu lomu daži no visvairāk mulsinošu neveiksmēm pirmajās dienās apsekojuma pētījumiem. Skaidrs piemērs, cik tālu mēs esam nonākuši ar ne-izlasēm pēc varbūtības ir izpēte Wei Wang, David Rothschild, Sharad Goel un Andrew Gelmana ka pareizi atgūt iznākumu 2012 ASV vēlēšanām, neizmantojot varbūtības izlasi American Xbox lietotāju -a visnotaļ nav izlases paraugu no amerikāņiem (Wang et al. 2015) . Pētnieki darbā respondenti no Xbox spēļu sistēmu, un, kā jūs varētu gaidīt, Xbox paraugs asimetrisks vīriešu un asimetrisks jauniešiem: 18-29 gadus veci jaunieši veido 19% no vēlētāju, bet 65% no Xbox parauga un vīrieši veido 47% vēlētāju un 93% no Xbox parauga (3.4 attēls). Sakarā ar šiem spēcīgu demogrāfisko aizspriedumiem, izejvielas Xbox dati bija slikts rādītājs vēlēšanu atdevi. Tā prognozēt spēcīgu uzvaru Mitt Romney pār Barack Obama. Atkal, šis ir vēl viens piemērs briesmām izejvielu, neizlīdzināti nav izlasēm pēc varbūtības un atgādina Literary Digest fiasko.

3.4 attēls: Demogrāfija respondentu Wang et al. (2015) . Jo respondenti tika pieņemti darbā no Xbox, tie biežāk ir jauni un, visticamāk, ir vīrietis, salīdzinot ar vēlētājiem 2012. gada vēlēšanās.

Tomēr Wang un kolēģi bija informēti par šīm problēmām, un mēģināja svaru respondentus, lai koriģētu atlases procesam. Jo īpaši tie izmanto sarežģītākas formu pēc stratifikācijas es jums stāstīju. Ir vērts mācīties nedaudz vairāk par savu pieeju, jo tas uzkrājas intuīciju par post-noslāņošanās, un īpaši versija Wang un kolēģi izmanto, ir viens no visvairāk aizraujošu pieejas svēršanas nav izlasēm pēc varbūtības.

Mūsu vienkāršs piemēram, par novērtējot bezdarba 3.4.1 iedaļā, mēs sadalīts iedzīvotāju grupās, pamatojoties uz rezidences valstī. Turpretim Wang un kolēģi sadalīts iedzīvotāju stājas spēkā 176,256 grupās, ko nosaka: dzimums (2 kategorijas), rases (4 kategorijas), vecuma (4 kategorijas), izglītība (4 kategorijas), valsts (51 kategorijas), partijas ID (3 kategorijas), ideoloģija (3 kategorijas) un 2008. balsot (3 kategorijas). Ar vairākām grupām, pētnieki cerēja, ka būtu vairāk iespējams, ka katrā grupā, atbilde tieksme bija nekorelē ar atbalstu Obama. Tālāk, nevis būvējot individuāla līmeņa svaru, kā mēs to darījām mūsu piemērā, Wang un kolēģi izmantoja sarežģītu modeli, lai novērtētu to cilvēku katrā grupā, kas varētu balsot par Obamu. Visbeidzot, viņi kopā šīs grupas aplēses atbalstu ar zināmu lielumu katrai grupai, lai iegūtu paredzēto kopējo atbalsta līmeni. Citiem vārdiem sakot, viņi sakapā iedzīvotāju dažādās grupās, aprēķināts, ka atbalsts Obamam katrā grupā, un tad ņēma vidējās svērtās grupas aprēķiniem, lai iegūtu vispārēju novērtējumu.

Tādējādi liels izaicinājums to pieejā ir novērtēt atbalstu Obamas katrā no šīm 176,256 grupām. Lai gan to panelis iekļauti 345,858 unikālu dalībnieku, milzīgs skaits ar standartiem vēlēšanu aptaujas, tur bija daudz, daudz grupas, kurām Wang un kolēģi bija gandrīz nav respondenti. Tādēļ, lai novērtētu atbalstu katrā grupā viņi izmanto tehniku, ko sauc par daudzlīmeņu regresijas ar pēc stratifikāciju, kas pētnieki affectionately saucam Mr P. Būtībā, lai novērtētu atbalstu Obama īpašā grupā, Mr. P. baseini informācija no daudziem cieši saistītas grupas. Piemēram, uzskata izaicinājums novērtētu atbalstu Obama vidū sieviešu, Hispanics, starp 18-29 gadus vecs, kas ir koledžas absolventi, kuri ir reģistrēti demokrāti, kuri sevi identificē kā mērenie, un kas balsoja par Obama 2008. Šis ir ļoti, ļoti īpašs grupu, un ir iespējams, ka nav neviena, paraugā ar šīm īpašībām. Tādēļ, lai padarītu aplēses par šīs grupas, Mr P. baseini kopā aplēsēm no cilvēkiem ļoti līdzīgās grupās.

Izmantojot šo analīzi stratēģiju, Wang un kolēģi bija iespēja izmantot Xbox nav varbūtības paraugs ļoti rūpīgi novērtēt vispārējo atbalstu, ka Obama saņemta 2012. gada vēlēšanās (3.5 attēls). Patiesībā viņu aplēses bija precīzāka nekā kopums sabiedriskās domas aptaujās. Tādējādi šajā gadījumā, svēršana, īpaši Mr. P.-šķiet, darīt labu darbu koriģējošu noviržu nav varbūtības datiem; aizspriedumi, kas ir redzami, kad paskatās aplēsēm no neizlīdzinātiem Xbox datiem.

3.5 attēls: aprēķini Wang et al. (2015) . Neizlīdzināti XBox paraugs ražots neprecīzas aplēses. Bet, svērtā Xbox paraugs ražots aplēses, kas bija precīzāka nekā vidēji varbūtību balstītu telefona aptaujas.

Ir divi galvenie secinājumi no pētījuma Wang un kolēģiem. Pirmkārt, neizlīdzinātie nav varbūtība paraugus var novest pie sliktiem aplēsēm; šī ir mācība, ka daudzi pētnieki ir dzirdējuši iepriekš. Tomēr otrā mācība ir tāda, ka nav varbūtības izlases, kad svērto pareizi, faktiski var radīt diezgan labus novērtējumus. Patiesībā, to aplēses bija precīzāki nekā aplēsēm pollster.com, apkopojumam tradicionālo vēlēšanu iecirkņiem.

Visbeidzot, ir svarīgi ierobežojumi, ko mēs varam mācīties no šī viena konkrētā pētījumā. Tikai tāpēc, ka post-noslāņošanās labi darbojās šajā konkrētajā gadījumā, nav nekādas garantijas, ka tā darbosies arī citos gadījumos. Patiesībā, vēlēšanas, iespējams, viens no vienkāršākajiem uzstādījumiem jo pollsters ir mācījušies vēlēšanas gandrīz 100 gadus, ir regulāra atgriezeniskā saite (mēs varam redzēt, kas uzvar vēlēšanās), un partijas identifikācijas un demogrāfiskais raksturojums ir salīdzinoši prognozēt balsošanas. Šajā brīdī, mēs trūkst stabilu teoriju un empīrisko pieredzi, lai zinātu, kad svars korekcijas nav izlasēm pēc varbūtības ražos pietiekami precīzus aprēķinus. Viena lieta, ka ir skaidrs, tomēr, ir, ja jums ir spiesti strādāt ar ne-izlasēm pēc varbūtības, tad ir nopietni iemesli uzskatīt, ka labotie novērtējumi būs labāk nekā neizlīdzinātiem aplēses.