3.4 Kuka kysyä

Todennäköisyys näytteet ja ei-todennäköisyysotantaan eivät ole niin erilaisia ​​käytännössä; molemmissa tapauksissa kyse on painot.

Näytteenotto on olennainen kartoittaa tutkimukseen. Tutkijat tuskin koskaan esittää kysymyksiään jokaiselle niiden kohderyhmä. Tältä osin tutkimukset eivät ole ainutlaatuisia. Useimmissa tutkimuksissa, tavalla tai toisella, liittyy näytteenottoa. Joskus tämä näytteenotto tehdään nimenomaan tutkijan; Muina aikoina se tapahtuu epäsuorasti. Esimerkiksi tutkija, joka kulkee laboratorion kokeen opiskelijaa hänen yliopisto on myös ottanut näytteen. Täten näytteenotto on ongelma, joka tulee esiin tässä kirjassa. Itse asiassa eräs yleisimmistä huolenaiheita, jotka kuulen digitaaliaikaan tietolähteitä on "eivät edusta." Kuten näemme tässä jaksossa, tämä huoli on sekä vähemmän vakavia ja hienovaraisempaa kuin monet epäilijät ymmärtävät. Itse aion väittävät, että koko käsite "edustavuus" ei ole hyödyllistä ajatella todennäköisyyden ja ei-todennäköisyysotantaan. Sen sijaan, avain on miettiä, miten tiedot on kerätty ja miten tahansa harhat että tiedonkeruun voidaan kumota tehtäessä arvioita.

Tällä hetkellä hallitseva teoreettinen lähestymistapa edustus on todennäköisyysotantaan. Kun tiedot kerätään todennäköisyydellä näytteenotto- menetelmä, joka on täydellisesti toteutettu, tutkijat pystyvät painottamaan tietonsa perustuvat siten, että ne on kerätty tekemään puolueettomia arvioita siitä kohderyhmä. Kuitenkin täydellinen todennäköisyysotantaan periaatteessa koskaan tapahdu todellisessa maailmassa. On tyypillisesti kaksi pääongelmaa 1) erot kohderyhmä ja rungon väestö ja 2) kato (nämä ovat juuri ne ongelmat, tuhonneet Kirjallisuuden Digest kyselyssä). Siten sen sijaan ajatellut todennäköisyysotantaan realistisena mallina, mitä todella tapahtuu maailmassa, se on parempi ajatella todennäköisyysotantaan hyödyllisenä, abstrakti malli, aivan kuten tapa fyysikot ajatella kitkatonta pallo vierii alas äärettömän pitkä ramppi.

Vaihtoehtona todennäköisyysotantaan on ei-todennäköisyysotantaan. Suurin ero todennäköisyyden ja ei-todennäköisyysotantaan on, että todennäköisyys näytteenotto kaikille väestöstä on tunnettu todennäköisyys osallisuutta. On itse asiassa monet lajikkeet kuin todennäköisyysotantaan, ja nämä tiedonkeruumenetelmistä yleistyvät digitaaliaikana. Mutta ei-todennäköisyysotantaan on kauhea maine yhteiskuntatieteilijät ja tilastotieteilijät. Itse asiassa ei-todennäköisyysotantaan liittyy joitakin kaikkein dramaattinen epäonnistumisia kyselyn tutkijoiden, kuten Kirjallisuuden Digest fiasko (käsitelty aiemmin) ja väärän ennusteen Yhdysvaltain presidentinvaalien 1948 ( "Dewey Tappiot Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Kuitenkin nyt on oikea aika harkita kuin todennäköisyysotantaan kahdesta syystä. Ensinnäkin, koska todennäköisyys näytteet ovat yhä vaikea tehdä käytännössä linjan välillä todennäköisyysotantaan ja ei-todennäköisyysotantaan hämärtyy. Kun on nopean ei-vasteen (koska on olemassa todellisessa tutkimukset nyt), todellinen todennäköisyys sulkeumia vastaajille ei tiedetä, ja siten, todennäköisyys näytteet ja ei-todennäköisyys näytteitä ole niin erilainen kuin monet tutkijat uskovat. Itse asiassa, kuten näemme alla, molemmat lähestymistavat pohjimmiltaan luottaa samoihin estimointimenetelmään: jälkiositukseen. Toiseksi, on ollut monia kehitykseen tietojen keräämistä ja analysointia kuin todennäköisyysotantaan. Nämä menetelmät ovat erilaisia ​​tarpeeksi menetelmistä, joka aiheutti ongelmia aikaisemmin, että mielestäni on järkevää ajatella niitä "ei-todennäköisyysotantaan 2.0." Meidän ei pitäisi olla irrationaalinen vastenmielisyys kuin todennäköisyys menetelmiä erehdysten tapahtui kauan sitten.

Seuraavaksi jotta tätä väitettä konkreettisempi, minä tarkistaa standardin todennäköisyysotantaan ja painotus (3.4.1). Ideana on, että miten kerätyt tiedot pitäisi vaikuttaa miten teet arvioita. Erityisesti jos kaikki ei ole sama todennäköisyys osallisuuden, niin kaikilla pitäisi olla sama painoarvo. Toisin sanoen, jos näytteenotto ei ole demokraattinen, sitten arvioita ei pitäisi olla demokraattinen. Tutkittuaan painotus, minä kuvataan kaksi lähestymistapaa kuin todennäköisyysotantaan: joka keskittyy painotusta käsittelemään ongelmaa sattumanvaraisesti kerättyjen tietojen (jakso 3.4.2), ja joka yrittää asemoida tarkemmin, kuinka data on kerätyt (jakso 3.4.3). Argumentit varsinaisessa tekstissä selitetään sanoin ja kuvin; lukijoita, jotka haluaisivat enemmän matemaattinen käsittely pitäisi myös nähdä tekninen liite.