3.4.1 Todennäköisyys näytteenotto: tiedonkeruu ja tietojen analysointi

Painot voidaan kumota vääristymiä tahallisesti aiheuttamia näytteenottoprosessi.

Todennäköisyys näytteet ovat ne, joissa kaikki ihmiset ovat tiedossa, nollasta todennäköisyys osallisuutta, ja yksinkertaisin todennäköisyysotantaan suunnittelu on yksinkertaisella satunnaisotannalla jossa jokaisella on yhtäläinen todennäköisyys osallisuutta. Kun vastaajat valitaan kautta yksinkertaisella satunnaisotannalla täydellinen toteuttaminen, (esim, ei verkkoa virhettä eikä kato), sitten arvio on yksinkertaista, koska näyte-keskimäärin-be pienoiskoossa väestöstä.

Yksinkertaisella satunnaisotannalla käytetään harvoin käytännössä pelin. Pikemminkin, tutkijat tarkoituksella valita ihmisiä eriarvoiseen todennäköisyyksiä osallisuuden vähentämiseksi kustannuksia ja lisätä tarkkuutta. Kun tutkijat tarkoituksella valita ihmisiä eri todennäköisyyksiä osallisuutta, niin muutoksia tarvitaan kumota aiheuttamat vääristymät mittauksen,. Toisin sanoen, miten me yleistää näytteestä riippuu siitä, miten otos poimittiin.

Esimerkiksi nykyinen asukasluku Survey (CPS) käytetään Yhdysvaltain hallituksen arvioida työttömyysaste. Joka kuukausi noin 100000 ihmistä haastatellaan joko face-to-face tai puhelimitse, ja tuloksia käytetään tuottamaan arvioidun työttömyysaste. Koska hallitus haluaa arvioida työttömyysaste kussakin tilassa, se ei voi tehdä yksinkertainen satunnaisotos aikuisten koska se tuottaa liian harvat vastaajat valtioissa pienten populaatioiden (esim Rhode Island) ja liian monet peräisin valtioiden runsasväestöisiin (esim , Kalifornia). Sen sijaan CPS näytteitä ihmiset eri valtioissa eri nopeuksilla, prosessi nimeltä Osituksen kanssa epätasainen poimintatodennäköisyys. Jos esimerkiksi CPS halusi 2000 vastaajaa per tila, niin aikuisten Rhode Island olisi noin 30 kertaa suurempi todennäköisyys osallisuuden kuin aikuisilla Kaliforniassa (Rhode Island: 2000 vastaajaa per 800000 aikuiset vs California: 2000 vastaajaa per 30000000 aikuiset). Kuten näemme myöhemmin, tällainen näytteenotto epätasainen todennäköisyydellä tapahtuu verkossa tietolähteet liian, mutta toisin kuin CPS, näytteenotto mekanismi ei yleensä ole tiedossa tai valvonnassa tutkijan.

Koska näytteenottoa muotoilu, CPS ei ole suoraan edustava Yhdysvalloissa; se sisältää liian monta ihmistä Rhode Island ja liian vähän Kaliforniasta. Siksi olisi viisasta arvioida työttömyysaste maan työttömyysaste näytteessä. Sen sijaan otoskeskiarvo, se on parempi ottaa painotettu keskiarvo, kun painotus huomioon se, että ihmiset Rhode Island olivat todennäköisesti sisällytetä kuin ihmiset Kaliforniasta. Esimerkiksi jokainen Kaliforniasta olisivat upweighted- ne laskea enemmän arvioon-ja jokainen Rhode Island olisi painotusta pienennettäisiin-ne laskea vähemmän arvioon. Pohjimmiltaan sinulle annetaan enemmän ääntä ihmisille, että olet vähemmän todennäköisesti oppia.

Tämä lelu esimerkki havainnollistaa tärkeä, mutta yleisesti väärinymmärretty kohta: näyte ei tarvitse olla pienoiskoossa väestön voidakseen tuottaa hyviä arvioita. Jos riittävästi tietoa siitä, kuinka tiedot on kerätty, että tietoa voidaan käyttää tehtäessä arvioita näytteestä. Lähestymistapa Olen juuri kuvattu, ja että minä kuvaavat matemaattisesti teknisessä lisäyksessä-kuuluu joka klassisen todennäköisyysotantaan puitteissa. Nyt näytän, miten tämä sama ajatus voidaan soveltaa ei-todennäköisyysotantaan.