3.3.1 Zastúpenie

Zastúpenie je asi robiť závery zo svojich respondentov pre vašu cieľovú populáciu.

Aby sme porozumeli druhu chýb, ktoré sa môžu vyskytnúť pri odvodení od respondentov k väčšej populácii, uvažujme o prieskume slabík Literary Digest, ktorý sa pokúsil predpovedať výsledok prezidentských volieb v roku 1936 v USA. Hoci sa to stalo pred viac ako 75 rokmi, tento debakl ešte stále má dôležitú lekciu na to, aby sme dnes vedeli výskumníkov.

Literárny Digest bol populárny časopis všeobecného záujmu a od roku 1920 začali slávnostné prieskumy verejnej mienky na predpovedanie výsledkov prezidentských volieb. Ak chcete urobiť tieto predpovede, posielajú hlasovacie lístky mnohým ľuďom a potom jednoducho spočítajú hlasovacie lístky, ktoré boli vrátené; Literárne Digest hrdo hlásil, že hlasovacie lístky, ktoré dostali neboli ani "vážené, upravená, ani interpretované." Tento postup správne predpovedal víťaza volieb v roku 1920, 1924, 1928 a 1932. V roku 1936, v stredu veľkej depresie, literárne Digest poslal hlasovacie lístky na 10 miliónov ľudí, ktorých mená pochádzali prevažne z telefónnych zoznamov a registračných záznamov automobilov. Tu je návod, ako opísali svoju metodiku:

"Stroj DIGEST s plynulým chodom sa pohybuje s rýchlou presnosťou tridsiatich rokov skúseností, aby sa znížila hádka na tvrdé fakty ... Tento týždeň 500 perí škrabalo viac ako štvrť milióna adries denne. Každý deň vo veľkej miestnosti vysoko nad štvrtou Avenue s motorovou stuhou v New Yorku 400 pracovníkov rýchlo posúva milión kusov tlačených materiálov - dosť na to, aby dali štyridsať mestských blokov - do adresovaných obálok [sic]. Každá hodina, v vlastnej pošovej stanici DIGESTu, tri štipľavé poštové meracie stroje zapečatili a opečiatkovali biele obdĺžniky; kvalifikovaní poštoví zamestnanci ich prevrátili do vypuklých poštových zásielok; flotily DIGEST nákladné autá posunuli ich na expresné poštové vlaky. , , Nasledujúci týždeň prvé odpovede z týchto desiatich miliónov začnú prichádzajúci príliv značených hlasovacích lístkov, trikrát kontrolované, overené, päťnásobné krížové klasifikácie a celkový počet. Keď je posledný údaj vyčíslený a skontrolovaný, ak je skúsenosť z minulosti kritériom, krajina bude vedieť, že v rámci zlomku 1 percenta bude skutočné hlasovanie štyridsať miliónov [voličov]. "(22. augusta 1936)

Literárna Digestova fetišizácia veľkosti je okamžite rozpoznateľná každému výskumníkovi "veľkých dát". Z 10 miliónov rozdelených hlasovacích lístkov bolo vrátených neuveriteľných 2,4 milióna, čo je zhruba 1000 krát väčšia ako moderné politické prieskumy. Z týchto 2,4 miliónov respondentov bol rozsudok jasný: Alf Landon sa chystá poraziť úradujúci Franklin Roosevelt. Ale v skutočnosti Roosevelt porazil Landona v zosuvu pôdy. Ako by mohol Literárny Digest pokaziť toľko dát? Naše moderné chápanie odberu vzoriek je zrejmé z chýb Literary Digest a pomáha nám vyhnúť sa podobným chybám v budúcnosti.

Jasné myslenie o odbere vzoriek si vyžaduje, aby sme zvážili štyri rôzne skupiny ľudí (obrázok 3.2). Prvá skupina je cieľová populácia . toto je skupina, ktorú výskumník definuje ako populáciu, ktorá je predmetom záujmu. V prípade Literary Digest bola cieľová populácia voličmi v prezidentských voľbách v roku 1936.

Po rozhodovaní o cieľovej populácii musí výskumník vytvoriť zoznam ľudí, ktorí sa môžu použiť na odber vzoriek. Tento zoznam sa nazýva vzorkovací rámec a ľudia na ňom sa nazývajú rámcová populácia . V ideálnom prípade by cieľová populácia a populácia rámcov boli úplne rovnaké, ale v praxi to často nie je prípad. Napríklad v prípade Literary Digest bola populácia rámcov 10 miliónov ľudí, ktorých mená pochádzali prevažne z telefónnych zoznamov a registračných záznamov automobilov. Rozdiely medzi cieľovou populáciou a populáciou rámcov sa nazývajú chyba pokrytia . Chyba pokrytia sama osebe nezaručuje problémy. Môže to však viesť k zaujatosti pokrytia, ak sa ľudia v rámcovej populácii systematicky odlišujú od ľudí v cieľovej populácii, ktorí nie sú v rámcovej populácii. To je presne to, čo sa stalo v prieskume Literary Digest . Ľudia vo svojej skupine obyvateľov mali tendenciu viac podporovať Alf Landona, čiastočne preto, že boli bohatší (pripomínajúc si, že aj telefóny a automobily boli v roku 1936 pomerne nové a drahé). Takže v prieskume Literary Digest , chyba pokrytia viedla k zaujatosti pokrytia.

Obrázok 3.2: Chyby reprezentácie.

Obrázok 3.2: Chyby reprezentácie.

Po definovaní populácie rámcov je ďalším výskumníkom výber vzorky populácie ; to sú ľudia, ktorých sa výskumník pokúsi pohovoriť. Ak vzorka má odlišné vlastnosti ako populácia rámcov, potom môže odber vzoriek zavádzať chybu odberu vzoriek . V prípade fiasko Literary Digest sa však v skutočnosti neobjavil žiaden odber - časopis, aby sa kontaktovali s každým v rámcovom počte obyvateľov - a preto nedošlo k chybe vzorkovania. Mnohí vedci majú tendenciu sústrediť sa na chybu v odbere vzoriek - je to typicky jediný druh chyby zachytený chybovým rozpätím hláseným v prieskumoch -, ale literárny Digest fiasco nám pripomína, že musíme zvážiť všetky zdroje chyby, náhodné aj systematické.

Nakoniec, po výbere vzorovej populácie sa výskumník pokúsi rozhovor so všetkými svojimi členmi. Tí ľudia, ktorí sú úspešne rozhovormi, sa nazývajú respondenti . V ideálnom prípade by populácia vzorky a respondenti boli presne to isté, ale v praxi neexistuje odpoveď. To znamená, že ľudia, ktorí sú vybraní vo vzorke, sa niekedy nezúčastňujú. Ak sa ľudia, ktorí reagujú, líšia od tých, ktorí nereagujú, potom môže dôjsť k absenciu odpovede . Nečakaná odpoveď bola druhým hlavným problémom pri prieskume Literary Digest . Iba 24% ľudí, ktorí dostali hlasovací lístok, reagovalo a ukázalo sa, že ľudia, ktorí podporovali Landon, reagovali viac.

Okrem toho, že len príkladom predstavenia myšlienok zastúpenia je prieskum literárneho Digestu často opakovaným podobenstvom, varujúc výskumníkov pred nebezpečenstvami náhodného odberu vzoriek. Bohužiaľ si myslím, že poučenie, ktoré mnohí ľudia čerpajú z tohto príbehu, je zlé. Najčastejšou morálkou príbehu je, že vedci sa nedokážu naučiť nič od vzoriek s nepravdepodobnosťou (tj vzorky bez prísnych pravidiel založených na pravdepodobnostiach pre výber účastníkov). Ale ako ukážem neskôr v tejto kapitole, nie je to úplne správne. Namiesto toho si myslím, že tento príbeh má naozaj dve morálky. morálky, ktoré sú dnes rovnako pravdivé ako v roku 1936. Po prvé, veľké množstvo náhodne zhromaždených údajov nezaručí dobrý odhad. Všeobecne platí, že s veľkým počtom respondentov sa znižuje odchýlka odhadov, ale nemusí nevyhnutne znižovať zaujatosť. S množstvom údajov môžu výskumníci niekedy získať presný odhad nesprávnej veci; môžu byť presne nepresné (McFarland and McFarland 2015) . Druhou hlavnou lekciou z literárneho Digest fiasco je, že výskumníci potrebujú zistiť, ako bola ich vzorka zhromaždená pri tvorbe odhadov. Inými slovami, vzhľadom na to, že proces odberu vzoriek v prieskume Literary Digest bol systematicky skreslený voči niektorým respondentom, výskumníci potrebovali použiť zložitejší proces odhadu, ktorý vážil niektorých respondentov viac ako ostatní. Neskôr v tejto kapitole vám ukážem jeden taký postup váženia - post stratifikácia - ktorý vám umožní lepšie odhady od náhodných vzoriek.