3.4.2 Nie-waarskynlikheid monsters: gewig

Hierdie vertaling is geskep deur 'n rekenaar. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Nie-waarskynlikheid monsters: gewig

Met nie-waarskynlikheid monsters, kan gewigte ondergang veroorsaak word deur die veronderstelde steekproefproses ongedaan te maak.

Op dieselfde wyse dat navorsers gewig antwoorde van waarskynlikheid monsters, kan hulle ook antwoorde van nie-waarskynlikheid monsters gewig. Byvoorbeeld, as 'n alternatief vir die CPS, dink dat jy banner advertensies geplaas op duisende bladsye om deelnemers te werf vir 'n opname om die werkloosheidskoers te skat. Natuurlik, sal jy skepties dat die eenvoudige gemiddelde van jou monster 'n goeie skatting van die werkloosheidsyfer sal wees. Jou skeptisisme is waarskynlik omdat jy dink dat sommige mense is meer geneig om jou opname as ander te voltooi. Byvoorbeeld, mense wat nie baie tyd nie spandeer op die web is minder geneig om jou vraelys te voltooi.

Soos ons gesien het in die laaste gedeelte, maar indien ons weet hoe die monster is gekies-as ons dit doen met waarskynlikheid monsters-dan kan ons ondergang veroorsaak word deur die monsterneming proses ongedaan te maak. Ongelukkig, wanneer daar gewerk word met nie-waarskynlikheid monsters, ons weet nie hoe die monster is gekies. Maar, kan ons aannames oor die sampling proses te maak en dan toe te pas gewig op dieselfde manier. As hierdie aannames korrek is, dan sal die gewig van die ondergang wat veroorsaak word deur die monsterneming proses ongedaan te maak.

Byvoorbeeld, dink dat in reaksie op jou banner advertensies, jy 100,000 respondente gewerf. Maar, het jy nie glo dat hierdie 100,000 respondente is 'n eenvoudige ewekansige steekproef van Amerikaanse volwassenes. Trouens, wanneer jy jou respondente te vergelyk met die Amerikaanse bevolking, sal jy vind dat mense uit sommige lande (bv, New York) is oorverteenwoordig is en dat mense van sommige lande (bv, Alaska) is onder verteenwoordig. So, die werkloosheidsyfer van jou monster is geneig om 'n slegte skat van die werkloosheidsyfer in die teikenpopulasie wees.

Een manier om die ondergang wat gebeur het in die monsterneming proses ongedaan is om gewigte aan elke persoon toewys; laer gewigte om mense uit lande wat oorverteenwoordig in die monster (bv, New York) en hoër gewigte om mense uit lande wat onder verteenwoordig in die monster (bv, Alaska). Meer spesifiek, is die gewig van elke respondent wat verband hou met hul voorkoms in jou monster in vergelyking met hul voorkoms in die Amerikaanse bevolking. Dit gewig prosedure staan bekend as post-stratifikasie, en die idee van 'n gewig moet jy herinner aan die voorbeeld in Afdeling 3.4.1 waar respondente uit Rhode Island minder gewig gekry as respondente van Kalifornië. Post-stratifikasie vereis dat jy genoeg om jou die respondente in groepe te sit en om die verhouding van die teikenpopulasie in elke groep ken weet.

Alhoewel die gewig van die waarskynlikheid monster en van die nie-waarskynlikheid monster is dieselfde wiskundig (sien tegniese bylaag), werk hulle goed in verskillende situasies. As die navorser het 'n perfekte waarskynlikheid monster (dit wil sê, geen dekking fout en geen nie-reaksie), dan sal gewig onbevooroordeelde ramings vir alle eienskappe in alle gevalle te produseer. Hierdie sterk teoretiese waarborg is waarom voorstanders van waarskynlikheid monsters vind hulle so aantreklik. Aan die ander kant, sal gewig nie-waarskynlikheid monsters net produseer onbevooroordeelde ramings vir alle eienskappe as die reaksie neigings is dieselfde vir almal in elke groep. Met ander woorde, dink terug aan ons 'n voorbeeld, die gebruik van post-stratifikasie sal onbevooroordeelde ramings te produseer as almal in New York het dieselfde kans om deel te neem en almal in Alaska het dieselfde kans om deel te neem en so aan. Hierdie aanname word genoem die homogene-reaksie-neigings-binne-groepe aanname, en dit speel 'n sleutelrol in die wete as post-stratifikasie goed sal werk met 'n nie-waarskynlikheid monsters.

Ongelukkig, in ons voorbeeld, lyk dit onwaarskynlik om waar te wees die homogene-reaksie-neigings-binne-groepe aanname. Dit is, dit lyk onwaarskynlik dat almal in Alaska het dieselfde kans het om in jou opname. Maar, daar is drie belangrike punte om in gedagte te hou oor post-stratifikasie, wat almal maak dit lyk meer belowend.

Eerstens, homogene-reaksie-neigings-binne-groepe aanname word meer geloofwaardig as die aantal groepe verhoog. En, is navorsers nie beperk tot groepe net gebaseer op 'n enkele geografiese dimensie. Byvoorbeeld, kan ons groepe te skep wat gebaseer is op die staat, ouderdom, geslag, en vlak van onderwys. Dit lyk meer geloofwaardig dat daar homogene reaksie neigings binne die groep 18-29, vroulike, kollege gegradueerdes wat in Alaska as binne die groep al die mense wat in Alaska. Dus, as die aantal groepe wat gebruik word vir post-stratifikasie toeneem, sal die aannames wat nodig is om te ondersteun dit meer redelik is. Gegewe hierdie feit, dit lyk soos 'n navorsers wil 'n groot aantal groepe vir post-stratifikasie te skep. Maar, as die aantal groepe toeneem, navorsers loop in 'n ander probleem: data sparsity. Indien daar slegs 'n klein aantal mense in elke groep, dan sal die skattings meer onseker wees, en in die uiterste geval waar daar 'n groep wat nie die respondente het, dan post-stratifikasie breek heeltemal af. Daar is twee maniere om uit hierdie inherente spanning tussen die geloofwaardigheid van homogeneous- reaksie-geneigdheid-binne-groepe aanname en die vraag na redelike steekproefgroottes in elke groep. Een benadering is om te skuif na 'n meer gesofistikeerde statistiese model vir die berekening van gewigte en die ander is om 'n groter, meer diverse monster, wat help om te verseker redelike steekproefgroottes in elke groep in te samel. En soms navorsers doen albei, soos ek sal hieronder beskryf in meer detail.

'N Tweede oorweging wanneer daar gewerk word met 'n post-stratifikasie van nie-waarskynlikheid monsters is dat die homogene-reaksie-geneigdheid-binne-groepe aanname is reeds dikwels gemaak ontleed waarskynlikheid monsters. Die rede is dat hierdie aanname is nodig vir waarskynlikheid monsters in die praktyk is dat waarskynlikheid monsters het nie-reaksie, en die mees algemene metode vir die aanpassing vir nie-reaksie is post-stratifikasie, soos hierbo beskryf. Natuurlik, net omdat baie navorsers 'n sekere aanname beteken nie dat jy dit ook moet doen. Maar, beteken dit dat wanneer vergelyk nie-waarskynlikheid monsters om waarskynlikheid monsters in die praktyk, moet ons in gedagte hou dat beide afhanklik van aannames en hulp inligting ten einde skattings produseer hou. In mees realistiese instellings, daar is eenvoudig geen aanname-vry benadering tot inferensie.

Ten slotte, as jy omgee vir een skatting in die besonder-in ons voorbeeld werkloosheidsyfer-dan kan jy 'n toestand swakker as homogene-reaksie-geneigdheid-binne-groepe aanname nodig. Spesifiek, het jy nie nodig om te aanvaar dat almal dieselfde reaksie geneigdheid, jy net nodig het om te aanvaar dat daar geen korrelasie tussen reaksie geneigdheid en werkloosheidsyfer binne elke groep. Natuurlik, sal selfs die swakker toestand nie hou in sommige gevalle. Byvoorbeeld, dink die beraming van die verhouding van die Amerikaners wat vrywillige werk te doen. As mense wat vrywillige werk doen, is meer geneig om saam te stem om te wees in 'n opname, dan navorsers stelselmatig oorskat die bedrag van vrywillige, selfs as hulle dit doen na-stratifikasie aanpassings, gevolg wat empiries bewys het deur Abraham, Helms, and Presser (2009) .

Soos ek vroeër gesê het, is nie-waarskynlikheid monsters beskou met groot skeptisisme deur sosiale wetenskaplikes, deels as gevolg van hul rol in 'n paar van die mees embarrassing mislukkings in die vroeë dae van opnamenavorsing. 'N Duidelike voorbeeld van hoe ver ons gekom het met 'n nie-waarskynlikheid monsters is die navorsing van Wei Wang, David Rothschild, Sharad Goel, en Andrew Gelman dat die uitslag van die 2012 Amerikaanse verkiesing korrek verhaal met behulp van 'n nie-waarskynlikheid monster van Amerikaanse Xbox gebruikers -a beslis nie-ewekansige steekproef van Amerikaners (Wang et al. 2015) . Die navorsers gewerf respondente uit die XBox speel stelsel, en as jy sou verwag, die Xbox monster skeef manlike en skeef jong: 18 - 29 jariges make-up 19% van die kiesers, maar 65% van die Xbox monster en mans make-up 47% van die kiesers en 93% van die Xbox monster (Figuur 3.4). As gevolg van hierdie sterk demografiese vooroordele, die rou Xbox data was 'n swak aanduiding van verkiesing opbrengste. Dit voorspel 'n sterk oorwinning vir Mitt Romney oor Barack Obama. Weereens, dit is nog 'n voorbeeld van die gevare van rou, onaangepaste nie-waarskynlikheid monsters en herinner aan die Literêre Digest fiasko.

Figuur 3.4: Demografiese inligting oor die respondente in Wang et al. (2015) . Omdat respondente gewerf uit XBox, was hulle meer geneig jong en meer geneig om manlike, relatief tot die kiesers in die verkiesing 2012 te wees.

Maar Wang en kollegas was bewus van hierdie probleme en probeer om die respondente gewig reg vir die monsterneming proses. In die besonder, het hulle gebruik 'n meer gesofistikeerde vorm van die post-stratifikasie ek jou vertel het. Dit is die moeite werd om te leer 'n bietjie meer oor hul benadering, want dit intuïsie oor post-stratifikasie bou, en die spesifieke weergawe Wang en kollegas gebruik is een van die mees opwindende benaderings tot gewig nie-waarskynlikheid monsters.

In ons eenvoudige voorbeeld oor die skatte van werkloosheid in Afdeling 3.4.1, ons verdeel die bevolking in groepe op grond van die staat van verblyf. In teenstelling, Wang en kollegas verdeel die bevolking in in 176256 groepe gedefinieer deur: geslag (2 kategorieë), ras (4 kategorieë), ouderdom (4 kategorieë), onderwys (4 kategorieë), staat (51 kategorieë), partytjie ID (3 kategorieë), ideologie (3 kategorieë) en 2008 stemme (3 kategorieë). Met meer groepe, het die navorsers gehoop dat dit toenemend waarskynlik dat binne elke groep, reaksie geneigdheid was ongekorreleerd met die ondersteuning vir Obama sou wees. Volgende, eerder as die bou van individuele vlak gewigte, soos ons in ons voorbeeld het, Wang en kollegas gebruik 'n komplekse model om die proporsie van mense skat in elke groep wat vir Obama sal stem. Ten slotte, gekombineer hulle hierdie groep skattings van ondersteuning met die bekende grootte van elke groep tot 'n geskatte algemene vlak van ondersteuning te produseer. Met ander woorde, gekap hulle die bevolking in verskillende groepe, beraam dat die steun vir Obama in elke groep, en dan het 'n geweegde gemiddelde van die skattings groep tot 'n algehele raming produseer.

So, die groot uitdaging in hul benadering is om die steun vir Obama skat in elkeen van hierdie 176256 groepe. Hoewel hul paneel ingesluit 345858 unieke deelnemers, 'n groot aantal deur die standaarde van die verkiesing stem, was daar baie, baie groepe waarvoor Wang en kollegas het byna geen respondente. Daarom, om die ondersteuning in elke groep wat hulle gebruik 'n tegniek genoem multi regressie met 'n post-stratifikasie, wat navorsers liefdevol mnr P. In wese noem, om die steun vir Obama skat binne 'n spesifieke groep, mnr P. poele inligting uit verskeie skat nou verwant groepe. Byvoorbeeld, kyk na die uitdaging van die skatte van die steun vir Obama onder vroulike, Hispanics, tussen 18-29 jaar oud, wat die kollege gegradueerdes, wat geregistreer Demokrate, wat self-identifiseer as gematigdes, en wat in 2008. Dit vir Obama gestem is 'n baie, baie spesifieke groep, en dit is moontlik dat daar niemand in die monster met hierdie eienskappe. Daarom, om skattings oor hierdie groep maak, mnr P. poele skat saam van mense in 'n baie soortgelyke groepe.

Die gebruik van hierdie analise strategie, Wang en kollegas in staat was om die XBox nie-waarskynlikheidsteekproef gebruik om baie nou skat die algehele ondersteuning wat Obama ontvang in die verkiesing 2012 (Figuur 3.5). In werklikheid was hulle skattings meer akkuraat as 'n totaal van openbare meningspeilings. So, in hierdie geval, gewig-spesifiek mnr P.-lyk na 'n goeie werk regstelling van die vooroordele in nie-waarskynlikheid data te doen; vooroordele wat sigbaar is as jy kyk na die skat van die onaangepaste Xbox data.

Figuur 3.5: Beramings van Wang et al. (2015) . Onaangepaste XBox monster geproduseer onakkurate skattings. Maar, die geweegde XBox monster geproduseer skat dat meer akkuraat as 'n gemiddeld van waarskynlikheid-gebaseerde telefoon opnames was.

Daar is twee hoof lesse uit die studie van Wang en kollegas. In die eerste plek kan onaangepaste nie-waarskynlikheid monsters lei tot slegte skat; dit is 'n les wat baie navorsers voorheen gehoor. Maar die tweede les is dat nie-waarskynlikheid monsters, wanneer dit behoorlik geweeg, kan eintlik produseer baie goed skat. Trouens, hul skattings was meer akkuraat as die skattings van pollster.com, 'n samevoeging van meer tradisionele verkiesing stembusse.

Ten slotte, daar is belangrike beperkings op wat ons kan leer uit hierdie een spesifieke studie. Net omdat post-stratifikasie goed gewerk in hierdie spesifieke geval, daar is geen waarborg dat dit goed sal werk in ander gevalle. Trouens, verkiesings is dalk een van die maklikste instellings omdat pollsters is die bestudering van verkiesings vir byna 100 jaar, is daar 'n gereelde terugvoer (ons kan sien wie die verkiesings wen), en party-identifikasie en demografiese kenmerke is relatief voorspelbare stem. Op hierdie punt, het ons nie vaste teorie en empiriese ervaring om te weet wanneer weeg aanpassings aan nie-waarskynlikheid monsters voldoende akkurate skattings sal produseer. Een ding wat duidelik is egter as jy gedwing word om te werk met 'n nie-waarskynlikheid monsters, dan is daar 'n sterk rede om te glo dat aangepaste beramings beter as nie-aangepaste beramings sal wees.