3.3.1 atstovybė

Atstovavimas yra apie priėmimo išvadas iš savo respondentų savo tikslinę gyventojų.

Norint suprasti klaidų, kad gali atsitikti, kai išvadą iš respondentų didesnei populiacijai natūra, aptarkime literatūrinės Digest šiaudų apklausą, kad bandė prognozuoti 1936 metų JAV prezidento rinkimus rezultatus. Nors tai buvo daugiau nei prieš 75 metų, tai ledonešis dar vaidina svarbų pamoka mokyti mokslininkus šiandien.

Literatūrinė Digest "buvo populiarus apskritai palūkanų žurnalas, ir pradedant 1920 metais jie pradėjo veikia šiaudų apklausas nuspėti prezidento rinkimų rezultatus. Norėdami atlikti šiuos spėjimus jie būtų siųsti biuletenius to daug žmonių, o tada tiesiog sutampa up balsus, kurie buvo grąžintos; Literatūrinė Digest "išdidžiai pranešė, kad balsavimai jie gavo nebuvo nei" įvertintą, pakoreguota, nei aiškinti ". Ši procedūra teisingai prognozavo nugalėtoją iš 1920, 1924, 1928 ir 1932 metais 1936 metais rinkimuose į Didžiosios depresijos įkarštyje, literatūros Digest "išsiuntė biuletenius 10 milijonų žmonių, kurių pavadinimai daugiausia atėjo iš telefono katalogų ir automobilių registracijos įrašais. Štai kaip jie aprašyti savo metodiką:

"Virinimo anketa sklandžiai veikia mašina juda SWIFT tikslumo trisdešimt metų patirtį, siekiant sumažinti spėlionė prie nepaneigiamų faktų. , , .Tai Savaitę 500 rašikliai subraižyti daugiau nei milijoną adresų ketvirtį per dieną. Kiekvieną dieną, į didelį kambarį virš varikliu Puoštas juostomis ketvirtosios Avenue, New York, 400 darbuotojai vikriai Slide milijonų vienetų spaudinių, užtenka nutiesti keturiasdešimt kvartalus-ąją spręsti vokų [sic]. Kas valandą santraukoje nuosavų pašte pastočių, trys Vibracija pašto matavimo mašinos uždaromos ir antspaudu baltas oblongs; kvalifikacijos pašto darbuotojai apversta juos į išsipūtimas mailsacks; laivynas Digest sunkvežimiai pagreitino jiems išreikšti paštu traukiniai. , , Kitą savaitę, pirmieji atsakymai iš šių dešimt milijonų pradės gaunamus banga pažymėtų biuletenių, turi būti trijų patikrinti, patikrintas, penkis kartus kryžminio skelbimą ir sudarė. Kai paskutinis skaičius buvo totted ir patikrinti, jei patirtis yra kriterijus, šalyje bus žinoti, kad per 1 proc faktinis visuotiniu balsavimu keturiasdešimt milijonų [rinkėjams] frakcija. "(Rugpjūčio 22 1936)

Virinimo anketa fetishization dydžio yra iškart atpažįstamas bet "didelis duomenų" mokslininko šiandien. Iš 10 mln balsavimai platinti, nuostabų 2,4 mln balsavimai buvo grąžinta-tai maždaug 1000 kartų didesni nei šiuolaikinių politinių apklausose. Iš šių 2,4 mln respondentų verdiktas buvo aiškus: Literatūrinė Digest "prognozavo, kad varžovas ALF Landon ėjo nugalėti dabartinis Franklin Roosevelt. Bet, tiesą sakant, visiškai priešinga atsitiko. Ruzveltas nugalėjo Landon į nuošliaužos. Kaip gali Literatūrinė Digest suklysti su tiek daug duomenų? Mūsų modernus supratimas ėmimo daro literatūrinio Digest anketa klaidų aišku ir padeda mums išvengti priimant panašius klaidų ateityje.

aiškiai galvoti apie mėginių ėmimą reikia mums apsvarstyti keturis skirtingus žmonių grupes (3.1 pav). Pirmoji grupė žmonių yra tikslinė populiacija; tai yra grupė, kad tyrimai apibrėžiama kaip interesų populiacijos. Atsižvelgiant į literatūros Digest atveju tikslinė populiacija buvo rinkėjai 1936 prezidento rinkimuose. Nusprendęs ant tikslinę populiaciją, mokslininkas šalia reikia sukurti žmonių, kurie gali būti naudojami mėginių ėmimo sąrašą. Šis sąrašas yra vadinamas Ėmimo ir gyventojų ant Ėmimo vadinama rėmo gyventojų. Atsižvelgiant į literatūros Digest atveju rėmas gyventojų buvo 10 milijonų žmonių, kurių pavadinimai atėjo daugiausia iš telefono katalogų ir automobilių registracijos įrašais. Idealiu atveju tikslinė populiacija ir rėmas populiacija būtų lygiai taip pat, tačiau praktiškai tai yra dažnai ne tas atvejis. Skirtumai tarp tikslinės populiacijos ir rėmo gyventojų vadinamas aprėptis klaida. Padengimas klaida nėra, savaime garantuoti problemas. Bet, jei kadre gyventojų žmonės yra sistemingai skiriasi nuo žmonių ne rėmo gyventojų bus aprėptis šališkumo. Padengimas klaida buvo pirmasis iš pagrindinių trūkumų su literatūros Digest apklausoje. Jie norėjo sužinoti apie rinkėjų-kad buvo jų tikslinė populiacija-bet jie sukonstravo imčių sistemą daugiausia iš telefono katalogų ir automobilių registrų, šaltinių, kad per mažai atstovaujama turtingesni amerikiečiai, kurie buvo labiau linkę palaikyti ALF Landon (Prisiminkite, kad abiejų šių technologijų, , kurie yra bendri šiandien, buvo palyginti naujas tuo metu, ir, kad JAV buvo Didžiosios depresijos viduryje).

Pav 3.1: Atstovavimas klaidų.

Pav 3.1: Atstovavimas klaidų.

Nustačius rėmo gyventojus, kitas žingsnis yra už mokslininko atrankai gyventojų; tai yra žmonės, kad mokslo bandys apklausti. Jeigu bandinys turi skirtingas savybes, nei rėmo gyventojų, tada mes galime pristatyti atrankos klaida. Tai yra klaidų rūšies kiekybiškai paklaida, kuri paprastai lydi sąmatas. Atsižvelgiant į literatūros Digest fiasko atveju, iš tikrųjų buvo ne pavyzdys; jie bandė susisiekti visus į rėmo gyventojų. Nors nebuvo atrankos paklaida, kad buvo akivaizdžiai vis dar klaida. Tai paaiškina, kad klaidų maržos, kurios paprastai pastebėtos su skaičiavimais iš apklausų paprastai klaidinamai mažas; jie neapima visų klaidų šaltinius.

Galiausiai mokslininkas bando apklausti visi mėginio gyventojų. Tie žmonės, kurie yra sėkmingai kalbinti vadinami respondentų. Idealiu atveju mėginys gyventojai ir respondentai būtų lygiai tas pats, tačiau praktiškai yra neatsakymo. Tai reiškia, kad žmonės, kurie yra atrinkti atsisakyti dalyvauti. Jei žmonės, kurie reaguoja skiriasi nuo tų, kurie nereaguoja, ten gali būti ne atsakas šališkumo. Neatsakymo šališkumo buvo antras Pagrindinė problema, su literatūrinio Digest apklausoje. Tik 24% žmonių, kurie gavo biuletenį atsakė, ir paaiškėjo, kad žmonės, kurie remiami Landon buvo labiau linkę reaguoti.

Peržengė vien pavyzdys įvesti atstovavimo idėjas, The literatūros Digest "apklausa yra dažnai kartojama parabolė, įspėja tyrėjai apie apie Nesėkmę ėmimo pavojų. Deja, manau, kad pamoka, kad daugelis žmonių padaryti iš šios istorijos yra negerai vienas. Dažniausiai Istorijos moralas yra tas, kad mokslininkai negali išmokti nieko iš netikimybinėje mėginių (ty mėginių be griežtų tikimybių pagrįstas taisykles atrankos dalyvių). Bet, kaip aš jums parodysiu vėliau šiame skyriuje, tai ne visai teisinga. Vietoj to, aš manau, yra tikrai du moralė į šią istoriją; moralė, kurios yra tiesa šiandien, kaip jie buvo 1936 Pirma, didelis kiekis Nesėkmę surinktų duomenų negarantuoja gerą įvertinimą. Antra, mokslininkams reikia apskaityti kaip jų duomenys buvo renkami, kai jie daro sąmatas iš jo. Kitaip tariant, dėl to, kad duomenų rinkimo procesas literatūriniame Digest apklausa buvo sistemingai iškreiptas į kai kurių respondentų, mokslininkams reikia naudoti sudėtingesnę įvertinimo procesas, kuris sveria kai kurie respondentai labiau nei kitiems. Vėliau šiame skyriuje, aš jums parodysiu, viena iš tokių svorių procedūra post-stratifikacija-kad, gali padėti jums priimti geresnius įvertinimus su netikimybinėje pavyzdžius.