3.4 kas paklausti

Tikimybinės imtys ir ne tikimybinės imtys yra ne tai, kad skiriasi praktiškai; abiem atvejais, tai visi apie svorius.

Atranka yra esminis apklausos tyrimai. Mokslininkai beveik niekada paklausti savo klausimus visiems savo tikslinę gyventojų. Šiuo atžvilgiu, apklausos nėra unikalus. Dauguma tyrimų, vienu ar kitu būdu, apima mėginių ėmimą. Kartais tai mėginiai imami aiškiai tyrėjas; kitais atvejais tai atsitinka netiesiogiai. Pavyzdžiui, mokslininkas, kuris veikia laboratorinį eksperimentą bakalauro studentai savo universitetą taip pat ėmėsi mėginį. Taigi, atranka yra problema, kad ateina per šią knygą. Iš tiesų, vienas iš labiausiai paplitusių problemų, kad aš išgirsti apie skaitmeninio amžiaus šaltinių duomenimis yra "jie neatspindi". Kaip matysime šiame skirsnyje, šis susirūpinimas yra tiek mažiau rimtas ir subtilesnė, nei daugelis skeptikų realizuoti. Tiesą sakant, aš teigti, kad visa koncepcija "reprezentatyvumo" nėra naudinga galvoti apie tikimybių ir ne tikimybių pavyzdžius. Vietoj to, kad svarbiausia yra galvoti apie tai, kaip buvo renkami duomenys ir kaip bet kokie duomenų rinkimo subtilybėmis gali būti atšauktas, kai priėmimo sąmatas.

Šiuo metu dominuojantis teorinis požiūris į atstovavimą yra tikimybė atranka. Kai duomenys renkami su tikimybių imčių metodą, kuris buvo puikiai įvykdytą, mokslininkai sugeba svorį savo duomenis remiantis taip, kad jie buvo surinkti, kad nešališką sąmatas apie tikslinės populiacijos. Tačiau puikiai tikimybinių imčių atranka iš esmės niekada neįvyksta realiame pasaulyje. Yra paprastai dvi pagrindinės problemos 1) skirtumai tarp tikslinės populiacijos ir rėmo gyventojų ir 2) ne-atsako (tai yra tiksliai problemos, sudaužyta literatūrinės Digest apklausą). Taigi, o ne galvoti apie tikimybinių imčių atranka kaip realus modelis, kas iš tikrųjų vyksta pasaulyje, tai geriau galvoti apie tikimybinių imčių atranka kaip naudinga, abstraktus modelis, panašiai kaip būdas fizikai galvoti apie trintį kamuolio riedėjimo žemyn be galo ilgai rampa.

Alternatyva tikimybinių imčių atranka yra ne tikimybė atranka. Pagrindinis skirtumas tarp tikimybės ir ne tikimybinių imčių atranka yra tai, kad su tikimybe mėginių ėmimo visiems į gyventojų turi žinomą tikimybę įtraukimo. Yra, tiesą sakant, daug veislių ne tikimybinių imčių atranka, ir šie duomenų rinkimo metodai vis dažniau skaitmeniniame amžiuje. Bet, ne tikimybinių imčių atranka turi siaubingą reputaciją tarp socialinių mokslininkų ir statistikos. Tiesą sakant, ne tikimybinių imčių atranka yra susijęs su kai kuriais iš labiausiai dramatiškų nesėkmių tyrimo tyrėjų, pavyzdžiui, literatūros Digest fiasko (aptarta anksčiau), o neteisingo prognozavimo apie JAV prezidento rinkimus 1948 ( "Dewey Pralaimėjimai Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Tačiau laikas yra teisė persvarstyti netikimybinėje atranką dėl dviejų priežasčių. Pirma, tikimybinės imtys tampa vis sunkiau padaryti praktiškai tarp tikimybių pavyzdžių ir ne tikimybių mėginių linija nyksta. Kai yra aukštas rodiklis neatsakymo (kaip yra realiai apklausų dabar), faktinis tikimybė intarpų respondentams nėra žinoma, todėl, tikimybinės imtys ir ne tikimybinės imtys nėra skirtingi, kaip daugelis mokslininkai mano. Iš tiesų, kaip matysime toliau, abu požiūriai iš esmės remtis ta pačia vertinimo metodas: po stratifikacijos. Antra, buvo daug pokyčių rinkimo ir analizės netikimybinėje pavyzdžius. Šie metodai yra pakankamai skiriasi nuo metodų, kurie sukėlė problemų praeityje, kad aš manau, kad tai prasminga galvoti apie juos kaip "ne tikimybinių imčių atranka 2.0." Mes neturėtų neracionali baimė ne tikimybių metodais, nes klaidų, kurios įvyko prieš daug laiko.

Be to, siekiant, kad šis argumentas daugiau betono, aš peržiūrėti standartinį tikimybinių imčių atranka ir svoriai (3.4.1 skyrių). Svarbiausia idėja yra ta, kad, kaip jūs surinkti duomenys turėtų įtakos, kaip jūs padaryti sąmatą. Visų pirma, jei kiekvienas neturi vienodos galimybės įtraukti, tada kiekvienas neturėtų turėti tą patį svorį. Kitaip tariant, jei jūsų atranka yra ne demokratinė, tada jūsų skaičiavimai neturėtų būti demokratiška. Peržiūrėję svorį, aš aprašyti du požiūrius į ne tikimybinių imčių atranka: vieną, kad pagrindinis dėmesys skiriamas koeficiento susidoroti su Nesėkmę surinktais duomenimis problemos (3.4.2 skyrius), ir vienas, kad bando dėti daugiau kontroliuoti, kaip duomenys yra surinkti (3.4.3 skyrius). Į pagrindinį tekstą argumentai bus paaiškinta toliau su žodžiais ir nuotraukomis; Skaitytojai, kurie norėtų daugiau matematinis apdorojimas taip pat turėtų matyti techniniame priede.