3.4 Wie vra

Waarskynlikheid monsters en nie-waarskynlikheid monsters is nie so anders in die praktyk; In beide gevalle, dit is alles oor die gewigte.

Monsterneming is fundamenteel tot navorsingsopname. Navorsers byna nooit hul vrae te vra aan almal in hul teikenpopulasie. In hierdie verband, opnames is nie uniek nie. Die meeste navorsing, op een of ander manier, behels steekproefneming. Soms steekproefneming is uitdruklik deur die navorser; ander kere is dit gebeur implisiet. Byvoorbeeld, het 'n navorser wat 'n laboratorium eksperiment op voorgraadse studente in haar universiteit het ook 'n monster geneem. So, steekproefneming is 'n probleem wat opkom regdeur die boek. Trouens, een van die mees algemene probleme wat ek hoor oor digitale era bronne van data is "het hulle is nie verteenwoordigend." Soos ons sal sien in hierdie afdeling, hierdie bekommernis is beide minder ernstige en meer subtiel as baie skeptici te verwesenlik. Trouens, sal ek argumenteer dat die hele konsep van "verteenwoordigendheid" is nie nuttig om te dink oor waarskynlikheid en nie-waarskynlikheid monsters. In plaas daarvan, die sleutel is om te dink oor hoe die data ingesamel is en hoe 'n vooroordele in daardie dataversameling kan ongedaan gemaak word wanneer die maak van skattings.

Op die oomblik is die dominante teoretiese benadering tot verteenwoordiging is waarskynlikheidsteekproefneming. Wanneer data ingesamel met 'n waarskynlikheid steekproefmetode wat perfek is uitgevoer, navorsers in staat om hul data gewig op grond van die manier waarop hulle versamel om onbevooroordeelde ramings oor die teikenpopulasie te maak. Maar perfekte waarskynlikheidsteekproefneming basies nooit gebeur in die werklike wêreld. Daar is gewoonlik twee grootste probleme 1) verskille tussen die teikenpopulasie en die raam bevolking en 2) nie-reaksie (dit is presies die probleme wat die Literêre Digest peiling gestrand). Dus, eerder as om te dink van waarskynlikheidsteekproefneming as 'n realistiese model van wat werklik gebeur in die wêreld, is dit beter om te dink aan waarskynlikheidsteekproefneming as 'n nuttige, abstrakte model, baie soos die manier fisici dink oor 'n wrywinglose bal aan die rol sit 'n oneindig lang oprit.

Die alternatief vir waarskynlikheidsteekproefneming is nie-waarskynlikheidsteekproefneming. Die belangrikste verskil tussen waarskynlikheid en nie-waarskynlikheidsteekproefneming is dat met waarskynlikheidsteekproefneming almal in die bevolking het 'n bekende waarskynlikheid van insluiting. Daar is, in werklikheid, baie variëteite van nie-waarskynlikheidsteekproefneming, en hierdie metodes van data-insameling word toenemend algemeen in die digitale era. Maar, nie-waarskynlikheidsteekproefneming het 'n vreeslike reputasie onder sosiale wetenskaplikes en statistici. Trouens, nie-waarskynlikheidsteekproefneming wat verband hou met 'n paar van die mees dramatiese mislukkings van opname navorsers, soos die literêre Digest fiasko (vroeër bespreek) en die verkeerde voorspelling van die Amerikaanse presidensiële verkiesing van 1948 ( "Dewey nederlae Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Maar die tyd is reg om nie-waarskynlikheidsteekproefneming te heroorweeg om twee redes. In die eerste plek as waarskynlikheid monsters al hoe moeiliker geword het om te doen in die praktyk, die lyn tussen waarskynlikheid monsters en nie-waarskynlikheid monsters is vervaag. Wanneer daar 'n hoë pryse van nie-reaksie (want daar is nou ware opnames), die werklike waarskynlikheid van insluitings vir die respondente is nie bekend, en dus, waarskynlikheid monsters en nie-waarskynlikheid monsters is nie so verskillend soos baie navorsers glo. Trouens, soos ons hieronder sal sien, beide benaderings basies staatmaak op dieselfde skatting metode: post-stratifikasie. In die tweede plek was daar baie ontwikkelings in die versameling en ontleding van nie-waarskynlikheid monsters is. Hierdie metodes is verskillende genoeg van die metodes wat veroorsaak probleme in die verlede wat ek dink dit maak sin om te dink aan dit as "nie-waarskynlikheidsteekproefneming 2.0." Ons moet 'n irrasionele afkeer van nie-waarskynlikheid metodes as gevolg van foute wat gebeur het nie lank gelede.

Volgende, ten einde hierdie argument meer konkrete maak, ek sal standaard waarskynlikheidsteekproefneming en gewig (Afdeling 3.4.1) te hersien. Die sleutel idee is dat hoe jy jou data ingesamel moet 'n impak hoe jy skattings te maak. In die besonder, as almal dieselfde waarskynlikheid van insluiting het nie, dan moet almal nie dieselfde gewig. Met ander woorde, as jou voorbeeld is nie demokratiese, dan is jou skattings moet nie demokratiese wees. Na die lees van gewig, sal ek twee benaderings te beskryf nie-waarskynlikheidsteekproefneming: een wat fokus op gewig te gaan met die probleem van lukraak data wat ingesamel is (Afdeling 3.4.2), en een wat probeer om meer beheer te plaas oor hoe die data is ingesamel (Afdeling 3.4.3). Die argumente in die hoofteks sal onder met woorde en prente verduidelik; lesers wat graag 'n meer wiskundige behandeling moet ook kyk na die tegniese bylae.