3.4.2 samplau nad ydynt yn debygolrwydd: pwysoli

Mae'r cyfieithiad ei greu gan gyfrifiadur. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 samplau nad ydynt yn debygolrwydd: pwysoli

Gyda samplau nad ydynt yn tebygolrwydd, gall pwysau dadwneud distortions a achosir gan y broses samplo tybiedig.

Yn yr un ffordd ag y mae ymchwilwyr pwysau ymatebion gan samplau tebygolrwydd, gallant hefyd pwysau ymatebion gan samplau nad ydynt yn tebygolrwydd. Er enghraifft, fel dewis arall i'r CPS, dychmygwch eich bod gosod hysbysebion baner ar filoedd o wefannau i recriwtio cyfranogwyr ar gyfer arolwg i amcangyfrif y gyfradd ddiweithdra. Yn naturiol, a fyddech yn amheus y byddai cymedrig syml o'ch sampl fod yn amcangyfrif da o'r gyfradd ddiweithdra. Mae eich amheuon, mae'n debyg, oherwydd eich bod yn meddwl bod rhai pobl yn fwy tebygol o gwblhau eich arolwg nag eraill. Er enghraifft, pobl nad ydynt yn treulio llawer o amser ar y we yn llai tebygol o gwblhau eich arolwg.

Fel y gwelsom yn yr adran olaf, fodd bynnag, os ydym yn gwybod sut y sampl ei ddewis-fel y gwnawn gyda thebygolrwydd samplau-yna gallwn ddadwneud distortions a achoswyd gan y broses samplu. Yn anffodus, wrth weithio gyda samplau nad ydynt yn tebygolrwydd, nid ydym yn gwybod sut y sampl ei ddewis. Ond, gallwn wneud rhagdybiaethau am y broses samplo ac yna gwneud cais pwysoli yn yr un ffordd. Os rhagdybiaethau hyn yn gywir, yna bydd y pwysiad ddadwneud y afluniadau a achoswyd gan y broses samplu.

Er enghraifft, dychmygwch fod mewn ymateb i'ch hysbysebion baner, byddwch yn recriwtio 100,000 o ymatebwyr. Fodd bynnag, nid ydych yn credu bod y rhain 100,000 o ymatebwyr yn sampl ar hap syml o oedolion Americanaidd. Yn wir, pan fyddwch yn cymharu eich ymatebwyr i'r boblogaeth yr Unol Daleithiau, byddwch yn canfod bod pobl o rai wladwriaethau (ee, Efrog Newydd) yn cael eu gorgynrychioli a bod pobl o rai wladwriaethau (ee, Alaska) eu tangynrychioli. Felly, y gyfradd ddiweithdra eich sampl yn debygol o fod yn amcangyfrif gwael y gyfradd ddiweithdra yn y boblogaeth darged.

Un ffordd o ddadwneud y afluniad a ddigwyddodd yn y broses samplu yw neilltuo pwysau i bob person; pwysau is i bobl o wladwriaethau sy'n cael eu cynrychioli'n ddigonol drosodd yn y sampl (ee, Efrog Newydd) a phwysau uwch i bobl o wladwriaethau sy'n cael eu tangynrychioli yn y sampl (ee, Alaska). Yn fwy penodol, mae'r pwysau ar gyfer pob ymatebydd yn gysylltiedig â'u cyffredinolrwydd yn eich sampl o'i gymharu â'u cyffredinolrwydd yn y boblogaeth yr Unol Daleithiau. Gelwir y weithdrefn bwysoli yn ôl-haenu, a dylai'r syniad o bwyso eich atgoffa o'r enghraifft yn Adran 3.4.1 lle mae ymatebwyr o Rhode Island rhoddwyd llai o sylw nag ymatebwyr o California. Ôl-haeniad yn mynnu eich bod yn gwybod digon i roi eich ymatebwyr mewn grwpiau ac i wybod y gyfran o'r boblogaeth darged ym mhob grŵp.

Er bod y pwysiad y sampl tebygolrwydd ac o'r sampl heb fod yn tebygolrwydd yr un fath yn fathemategol (gweler atodiad technegol), maent yn gweithio'n dda mewn gwahanol sefyllfaoedd. Os oes gan yr ymchwilydd sampl tebygolrwydd perffaith (hy, dim camgymeriad sylw ac nid oes diffyg ymateb), yna bydd pwysoliad cynhyrchu amcangyfrifon diduedd ar gyfer yr holl nodweddion ym mhob achos. Mae'r warant damcaniaethol cryf pam eiriolwyr o samplau tebygolrwydd dod o hyd iddynt mor ddeniadol. Ar y llaw arall, bydd samplau nad ydynt yn tebygolrwydd bwysoli ond yn cynhyrchu amcangyfrifon diduedd ar gyfer yr holl nodweddion os yw'r dueddfryd ymateb yr un fath i bawb ym mhob grŵp. Mewn geiriau eraill, gan feddwl yn ôl at ein enghraifft, defnyddio ôl-haeniad yn cynhyrchu amcangyfrifon diduedd os yw pawb yn Efrog Newydd yr un tebygolrwydd o gymryd rhan a phawb yn Alaska yr un tebygolrwydd o gymryd rhan ac yn y blaen. Gelwir y dybiaeth yw y dybiaeth homogenaidd-ymateb-dueddfryd-fewn-grwpiau, ac mae'n chwarae rhan allweddol mewn gwybod os bydd y swydd-haeniad yn gweithio'n dda gyda samplau nad ydynt yn tebygolrwydd.

Yn anffodus, yn ein enghraifft, y rhagdybiaeth homogenaidd-ymateb-dueddfryd-fewn-grwpiau ymddangos yn annhebygol o fod yn wir. Hynny yw, mae'n ymddangos yn annhebygol bod gan bawb yng Alaska yr un tebygolrwydd o fod yn eich arolwg. Ond, mae tri phwynt pwysig i'w cadw mewn cof am y swydd-haenau, pob un ohonynt yn ei gwneud yn ymddangos yn fwy addawol.

Yn gyntaf, tybiaeth homogenaidd-ymateb-dueddfryd-fewn-grwpiau yn dod yn fwy credadwy wrth i nifer y grwpiau yn cynyddu. Ac, nid yw ymchwilwyr yn gyfyngedig i grwpiau yn unig yn seiliedig ar ddimensiwn daearyddol sengl. Er enghraifft, gallem greu grwpiau sy'n seiliedig ar y wladwriaeth, oedran, rhyw, a lefel addysg. Mae'n ymddangos yn fwy credadwy bod dueddfryd ymateb unffurf o fewn y grŵp o 18-29, graddedigion benywaidd, coleg sy'n byw yn Alaska nag o fewn y grŵp o holl bobl sy'n byw yn Alaska. Felly, gan fod y nifer o grwpiau a ddefnyddir ar gyfer cynnydd ôl-haeniad, roedd angen i'r tybiaethau i'w gefnogi yn dod yn fwy rhesymol. O ystyried y ffaith hon, mae'n ymddangos fel y byddai ymchwilwyr yn awyddus i greu nifer fawr o grwpiau ar gyfer addysg ôl-haeniad. Ond, gan fod y nifer o grwpiau yn cynyddu, ymchwilwyr yn rhedeg i mewn i wahanol broblem: teneurwydd poblogaeth data. Os mai dim ond nifer fach o bobl ym mhob grŵp, yna bydd yr amcangyfrifon yn fwy ansicr, ac yn achos eithafol lle mae grŵp sydd heb ymatebwyr, ac yna ar ôl haeniad yn gyfan gwbl yn torri i lawr. Mae dwy ffordd allan o hyn tensiwn cynhenid rhwng y hygrededd y dybiaeth homogeneous- ymateb-duedd-fewn-grwpiau a'r galw am meintiau sampl rhesymol ym mhob grŵp. Un dull yw symud i fodel ystadegol mwy soffistigedig ar gyfer cyfrifo pwysau ac mae'r llall yn casglu, sampl mwy amrywiol mwy o faint, sy'n helpu i sicrhau meintiau sampl yn rhesymol ym mhob grŵp. Ac, weithiau ymchwilwyr yn gwneud y ddau, fel y byddaf yn disgrifio yn fwy manwl isod.

Mae ail ystyriaeth wrth weithio gyda ôl-haeniad o samplau nad ydynt yn tebygolrwydd yw bod y dybiaeth homogenaidd-ymateb-duedd-fewn-grwpiau sydd eisoes yn cael ei wneud yn aml wrth ddadansoddi samplau tebygolrwydd. Y rheswm bod angen rhagdybiaeth hon ar gyfer samplau tebygolrwydd yn ymarferol yw bod samplau tebygolrwydd cael nad ydynt yn ymateb, ac mae'r dull mwyaf cyffredin ar gyfer addasu ar gyfer diffyg ymateb yn ôl-haeniad fel y disgrifir uchod. Wrth gwrs, dim ond oherwydd bod llawer o ymchwilwyr yn gwneud nid dybiaeth benodol yn golygu y dylech chi ei wneud hefyd. Ond, mae'n golygu bod wrth gymharu samplau nad ydynt yn tebygolrwydd i samplau tebygolrwydd yn ymarferol, mae'n rhaid i ni gadw mewn cof bod y ddau yn dibynnu ar ragdybiaethau a gwybodaeth ategol er mwyn cynhyrchu amcangyfrifon. Mewn lleoliadau mwyaf realistig, nid yn syml, dim dull di-rhagdybiaeth i gasgliad.

Yn olaf, os ydych yn gofalu am un amcangyfrif yn arbennig-yn ein enghraifft diweithdra cyfradd-yna bydd angen gyflwr wannach nag homogenaidd-ymateb-duedd-fewn-grwpiau rhagdybiaeth. Yn benodol, nid oes angen i chi gymryd yn ganiataol bod gan bawb yr un duedd ymateb, dim ond angen i gymryd yn ganiataol nad oes unrhyw gydberthynas rhwng tuedd ymateb a chyfradd ddiweithdra o fewn pob grŵp. Wrth gwrs, ni fydd hyd yn oed cyflwr wannach hwn yn dal mewn rhai sefyllfaoedd. Er enghraifft, dychmygwch amcangyfrif y gyfran o Americanwyr sy'n gwneud gwaith gwirfoddol. Os bydd pobl sy'n gwneud gwaith gwirfoddol yn fwy tebygol o gytuno i fod mewn arolwg, yna ymchwilwyr fydd yn systematig dros-amcangyfrif faint o wirfoddoli, hyd yn oed os ydynt yn gwneud addasiadau ôl-haenu, canlyniad sydd wedi cael ei ddangos empirig gan Abraham, Helms, and Presser (2009) .

Fel y dywedais yn gynharach, samplau nad ydynt yn tebygolrwydd yn cael eu hystyried ag amheuaeth mawr gan wyddonwyr cymdeithasol, yn rhannol oherwydd eu rôl mewn rhai o'r methiannau mwyaf embaras yn y dyddiau cynnar o arolwg ymchwil. Enghraifft glir o ba mor bell yr ydym wedi dod â samplau nad ydynt yn tebygolrwydd yw ymchwil o Wei Wang, David Rothschild, Sharad Goel, ac Andrew Gelman a adenillwyd canlyniad yr etholiad Unol Daleithiau 2012 yn gywir gan ddefnyddio sampl heb fod yn tebygolrwydd o ddefnyddwyr Americanaidd Xbox -a sampl decidedly heb fod ar hap o Americanwyr (Wang et al. 2015) . Mae'r ymchwilwyr recriwtio ymatebwyr o'r system hapchwarae XBox, ac fel y gallech ddisgwyl, roedd y sampl Xbox gogwyddo gwrywaidd a sgiwio ifanc: 18 - oed 29 mlwydd yn cyfrif am 19% o'r etholwyr ond 65% o'r sampl Xbox a dynion yn cyfrif am 47% o'r etholwyr a 93% o'r sampl Xbox (Ffigur 3.4). Oherwydd y rhain tueddiadau demograffig cryf, mae'r data Xbox crai yn ddangosydd gwael ffurflenni etholiad. Mae'n rhagweld buddugoliaeth gref i Mitt Romney dros Barack Obama. Unwaith eto, mae hyn yn enghraifft arall o beryglon samplau nad ydynt yn tebygolrwydd amrwd, heb ei addasu ac yn atgoffa rhywun o'r fiasco Literary Digest.

Ffigur 3.4: Demograffeg yr ymatebwyr yn Wang et al. (2015) . Oherwydd bod yr ymatebwyr eu recriwtio o XBox, roeddent yn fwy tebygol o fod yn ifanc ac yn fwy tebygol o fod yn ddynion, o gymharu â pleidleiswyr yn yr etholiad 2012.

Fodd bynnag, Wang a chydweithwyr yn ymwybodol o'r problemau hyn ac yn ceisio bwysoli'r ymatebwyr i gywiro ar gyfer y broses samplu. Yn benodol, maent yn defnyddio ffurf fwy soffistigedig y swydd-haeniad Dywedais wrthych am. Mae'n werth dysgu ychydig mwy am eu dull am ei fod yn adeiladu greddf am ôl-haenu, ac mae'r fersiwn arbennig Wang a chydweithwyr a ddefnyddir yn un o'r dulliau mwyaf cyffrous i samplau nad ydynt yn tebygolrwydd pwysoli.

Yn ein enghraifft syml am amcangyfrif diweithdra yn Adran 3.4.1, rydym yn rhannu'r boblogaeth yn grwpiau yn seiliedig ar gyflwr preswyl. Mewn cyferbyniad, Wang a chydweithwyr rhannwyd y boblogaeth i mewn i 176,256 grwpiau a ddiffinnir gan: rhyw (2 gategori), hil (4 categori), oedran (4 categori), addysg (4 categori), y wladwriaeth (51 categori), ID parti (3 categorïau), ideoleg (3 chategori) a 2008 pleidlais (3 chategori). Gyda mwy o grwpiau, mae'r ymchwilwyr yn gobeithio y byddai'n fwyfwy tebygol, o fewn pob grŵp, ymateb duedd oedd uncorrelated gyda chefnogaeth ar gyfer Obama. Nesaf, yn hytrach na adeiladu pwysau ar lefel unigol, fel y gwnaethom yn ein enghraifft, defnyddiodd Wang a chydweithwyr model cymhleth i amcangyfrif y gyfran o bobl ym mhob grŵp a fyddai'n pleidleisio dros Obama. Yn olaf, maent yn cyfuno amcangyfrifon grŵp yma o gymorth gyda maint hysbys i bob grŵp gynhyrchu lefel gyffredinol amcangyfrif o gefnogaeth. Mewn geiriau eraill, maent yn torri'n fyny y boblogaeth i grwpiau gwahanol, amcangyfrifodd y gefnogaeth ar gyfer Obama ym mhob grŵp, ac yna cymerodd cyfartaledd pwysol o'r amcangyfrifon grŵp i gynhyrchu amcangyfrif cyffredinol.

Felly, yr her fawr yn eu dull yw amcangyfrif y gefnogaeth ar gyfer Obama ym mhob un o'r 176,256 o grwpiau. Er bod eu panel yn cynnwys 345,858 o gyfranogwyr unigryw, mae nifer fawr gan y safonau o bleidleisio etholiad, roedd llawer, llawer o grwpiau yr oedd Wang a chydweithwyr bron dim ymatebwyr. Felly, i amcangyfrif y gefnogaeth ym mhob grŵp eu bod yn defnyddio techneg o'r enw atchweliad aml-lefel gyda ôl-haenau, a oedd ymchwilwyr yn annwyl ffoniwch Mr. P. Yn y bôn, i amcangyfrif y gefnogaeth i Obama o fewn grŵp penodol, pyllau Mr. P. gwybodaeth o lawer grwpiau sy'n perthyn yn agos. Er enghraifft, ystyriwch yr her o amcangyfrif gefnogaeth i Obama ymhlith Hispanics benywaidd,, rhwng 18-29 oed, sy'n raddedigion coleg, sydd wedi eu cofrestru Democratiaid, sy'n hunan-adnabod fel cymedroli, ac a bleidleisiodd i Obama yn 2008. Mae hyn yn grŵp hynod, penodol iawn, ac mae'n bosibl nad oes unrhyw un yn y sampl sydd â nodweddion hyn. Felly, er mwyn gwneud amcangyfrifon am y grwp, pyllau Mr. P. gilydd amcangyfrifon o bobl mewn grwpiau tebyg iawn.

Gan ddefnyddio'r strategaeth dadansoddiad hwn, roedd Wang a chydweithwyr gallu defnyddio'r XBox sampl heb fod yn tebygolrwydd i amcangyfrif yn agos iawn y gefnogaeth gyffredinol a gafodd Obama yn etholiad 2012 (Ffigur 3.5). Yn wir eu hamcangyfrifon yn fwy cywir na'r cyfanred o arolygon barn y cyhoedd. Felly, yn yr achos hwn, pwysiad-benodol Mr. P.-ymddangos i wneud gwaith da gywiro'r tueddiadau mewn data nad yw'n tebygolrwydd; rhagfarnau sy'n weladwy pan fyddwch yn edrych ar yr amcangyfrifon o'r data Xbox heb ei addasu.

Ffigur 3.5: Amcangyfrifon o Wang et al. (2015) . sampl XBox heb ei addasu cynhyrchu amcangyfrifon anghywir. Ond, cynhyrchodd y sampl XBox bwysoli amcangyfrifon a oedd yn fwy cywir na'r cyfartaledd o arolygon ffôn sy'n seiliedig ar debygolrwydd.

Mae dau brif gwersi o astudio Wang a chydweithwyr. Yn gyntaf, gall samplau nad ydynt yn tebygolrwydd nas addaswyd yn arwain at amcangyfrifon drwg; mae hyn yn wers y mae llawer o ymchwilwyr wedi clywed o'r blaen. Fodd bynnag, mae'r ail wers yw bod samplau nad ydynt yn tebygolrwydd, pan bwysoli gywir, gall mewn gwirionedd yn cynhyrchu amcangyfrifon eithaf da. Yn wir, eu hamcangyfrifon yn fwy cywir na'r amcangyfrifon o pollster.com, yn agregiad o fwy polau etholiad traddodiadol.

Yn olaf, mae cyfyngiadau pwysig i beth allwn ni ddysgu o un astudiaeth benodol hon. Dim ond oherwydd ôl-haeniad gweithio'n dda yn yr achos penodol hwn, nid oes unrhyw sicrwydd y bydd yn gweithio'n dda mewn achosion eraill. Yn wir, etholiadau efallai yn un o'r lleoliadau hawsaf oherwydd pollsters wedi bod yn astudio etholiadau ar gyfer bron i 100 mlynedd, mae adborth rheolaidd (gallwn weld pwy fydd yn ennill yr etholiadau), ac adnabod parti a nodweddion demograffig yn gymharol rhagfynegol o bleidleisio. Ar y pwynt hwn, rydym yn brin o theori solet a phrofiad empirig i wybod pryd y bydd bwysoli'r addasiadau i samplau nad ydynt yn cynhyrchu amcangyfrifon tebygolrwydd ddigon cywir. Un peth sy'n glir, fodd bynnag, yw os ydych yn cael eu gorfodi i weithio gyda samplau nad ydynt yn tebygolrwydd, yna mae rheswm cryf i gredu y bydd amcangyfrifon haddasu yn well na'r amcangyfrifon heb eu haddasu.