3.3.1 Reprezento

Prezento estas pri faranta inferencoj de viaj respondantoj al via celo loĝantaro.

Por kompreni la specon de eraroj, kiuj povas okazi, kiam oni malsukcesas la enketojn al la pli granda loĝantaro, ni konsideras la enketon de pajlo de Literaturaj Digestoj, kiu provis antaŭdiri la rezulton de la prezidantaj elektoj de 1936. Kvankam ĝi okazis pli ol 75 jarojn, ĉi tiu debaklo ankoraŭ havas gravan lecionon por instrui esploristojn hodiaŭ.

Literatura Digesto estis populara ĝenerala intereso-revuo, kaj komencante en 1920 ili komencis kuradi pajlotojn por antaŭdiri la rezultojn de prezidantaj elektoj. Por fari ĉi tiujn antaŭdirojn, ili sendus biletojn al multaj homoj kaj tiam simple kalkulis la biletojn, kiuj estis revenitaj; Literatura Digesto fiere informis, ke la balotoj, kiujn ili ricevis, ne estis "pezaj, ĝustigitaj nek interpretitaj." Ĉi tiu proceduro ĝuste antaŭdiris la venkintojn de la elektoj en 1920, 1924, 1928 kaj 1932. En 1936, meze de la Granda Depresio, Literatura Digest sendis biletojn al 10 milionoj da homoj, kies nomoj venis ĉefe de telefonaj adresaroj kaj aŭtoj-registraj registroj. Jen kiel ili priskribis sian metodikon:

"La milda maŝino de la DIGESTO movas kun la rapida precizeco de tridek jaroj da sperto por redukti divenojn al malmolaj faktoj ... Ĉi tiu semajno 500 plumoj elĉerpis pli ol kvaronon miliono da adresoj tage. Ĉiutage, en granda ĉambro alte super la Kvara Avenuo, en Nov-Jorko, 400 laboristoj malplenigas milionojn da presitaj aferoj - sufiĉe por kvardek urbaj blokoj - en la direktitajn envolvojn [sic]. Ĉiu horo, en la Poŝtofonejo de la DIGESTO, tri maŝinaj maŝinoj stampis kaj stampis la blankajn oblongojn; kvalifikitaj poŝtistoj dungis ilin en bulajn mailsakojn; Flotaj kamionoj de vestaĵoj flotis ilin por esprimi retpoŝtonojn. . . La sekvan semajnon, la unuaj respondoj de tiuj dek milionoj komencos la venontajn tajdojn de markitaj biletoj, esti trifoje-kontrolitaj, kontrolitaj, kvinfoje transkalkulataj kaj kompletigitaj. Kiam la lasta cifero estis forigita kaj kontrolita, se pasinta sperto estas kriterio, la lando konos ene de frakcio de 1 procento la reala populara voĉdono de kvardek milionoj [balotantoj]. "(22an de aŭgusto 1936)

Literaturaj Digestoj de grandeco estas tuj rimarkindaj al iu ajn "granda datumo" esploristo hodiaŭ. De la 10 milionoj da biletoj distribuitaj, mirindaj 2.4 milionoj estis redonitaj - tio estas proksimume 1,000 fojojn pli grandaj ol modernaj politikaj balotadoj. De ĉi tiuj 2.4 milionoj da respondantoj, la verdikto estis klara: Alf Landon tuj venkos la estron Franklin Roosevelt. Sed, fakte, Roosevelt venkis Landon en derrumbe. Kiel povus Literatura Digesto iri malbone kun tiom da datumoj? Nia moderna kompreno pri sampado faras klarajn erarojn de Literaturaj Digestoj kaj helpas nin eviti fari similajn erarojn en la estonteco.

Pensante klare pri sampado postulas nin konsideri kvar malsamajn grupojn de homoj (figuro 3.2). La unua grupo estas la objektiva loĝantaro ; ĉi tiu estas la grupo, kiun la esploristo difinas kiel la populacio de intereso. En la kazo de Literatura Digesto , la celo populacio estis balotantoj en la prezidanta elekto de 1936.

Post decidi pri celo de loĝantaro, esploristo devas evoluigi liston de homoj, kiuj povas esti uzataj por provo. Ĉi tiu listo estas nomata specimenkadro kaj la homoj sur ĝi estas nomataj la kadra populacio . Ideale, la cela loĝantaro kaj la kadra populacio estus ekzakte samaj, sed praktike ĉi tio ofte ne estas. Ekzemple, en la kazo de Literatura Digesto , la kadra loĝantaro estis la 10 milionoj da homoj kies nomoj venis ĉefe de telefonaj adresaroj kaj aŭtomobrikaj registroj. Diferencoj inter la cela loĝantaro kaj la kadra populacio estas nomataj kovrara eraro . Kovra eraro ne, per si mem, garantias problemojn. Tamen, ĝi povas konduki al kovrado antaŭdiro se homoj en la kadra populacio estas sisteme malsamaj al homoj en la cela loĝantaro, kiuj ne estas en la kadra populacio. Ĉi tio estas, fakte, ĝuste kio okazis en la enketo de Literaturaj Digestoj . La homoj en ilia kadra populacio inklinis esti pli inklinaj subteni Alf Landon, parte ĉar ili estis pli riĉaj (memoru, ke ambaŭ telefonoj kaj aŭtoj estis relative novaj kaj multekostaj en 1936). Do, en la kontinua balotado de Literaturaj Digestoj , kovra eraro kondukis al kovrado antaŭdiro.

Figuro 3.2: Reprezentaj eraroj.

Figuro 3.2: Reprezentaj eraroj.

Post difini la kadron de loĝantaro , la sekva paŝo estas por esploristo elekti la specimenon de loĝantaro ; Ĉi tiuj estas la homoj, kiujn la esploristo provos intervjui. Se la specimeno havas malsamajn trajtojn ol la kadra populacio, tiam specimenado povas enkonduki specimenan eraron . En la kazo de la fiasko de Literaturaj Digestoj , tamen, efektive ne estis specimeno - la revuo kontakti ĉiujn en la kadra populacio-kaj sekve ne ekzistis eraro. Multaj esploristoj inklinas fokusigi la samplan eraron - ĉi tio estas tipe la sola eraro kaptita de la rando de eraro raportita en enketoj - sed la fiasko de Literaturaj Digestoj memorigas nin, ke ni devas konsideri ĉiujn fontojn de eraroj, ambaŭ hazardaj kaj sistemaj.

Fine, post elektado de specimena loĝantaro, esploristo provas intervjui ĉiujn siajn membrojn. Tiuj homoj kun sukceso intervjuitaj estas nomataj respondantoj . Ideale, la specimena loĝantaro kaj la enketantoj estus ekzakte samaj, sed praktike ne respondas. Tio estas, homoj, kiuj estas elektitaj en la specimeno, kelkfoje ne partoprenas. Se la homoj, kiuj respondas, estas malsamaj al tiuj, kiuj ne respondas, tiam povas esti ne responda antaŭjuĝo . Ne responda parolado estis la dua ĉefa problemo kun la Literatura Kalkulado . Nur 24% de la homoj, kiuj ricevis baloton respondis, kaj rezultis, ke homoj, kiuj subtenis Landon, estis pli verŝajne respondi.

Pli ol nur ekzemplo por enkonduki la ideojn de reprezento, la Literatura Kalkulado- balotado estas trompita parabolo, atentante esploristojn pri la danĝeroj de haphazard-specimenado. Bedaŭrinde, mi opinias, ke la leciono, kiun multaj homoj tiris de ĉi tiu rakonto, estas la malĝusta. La plej ofta moralaĵo de la rakonto estas, ke esploristoj ne povas lerni ion ajn de ne-probablaj specimenoj (te, specimenoj sen striktaj probablaj reguloj por elektantaj partoprenantoj). Sed, kiel mi montros poste en ĉi tiu ĉapitro, tio ne pravas. Anstataŭe, mi pensas, ke vere estas du moralaj al ĉi tiu rakonto; moralajĵoj, kiuj estas tiel veraj hodiaŭ kiel ili estis en 1936. Unue, granda kvanto da haŭgaj kolektitaj datumoj ne garantias bonan takson. Ĝenerale, havante grandan numeron de enketitaj malpliigas la variancon de taksoj, sed ĝi ne nepre malpliigas la antaŭjuĝon. Kun multaj datumoj, esploristoj povas foje akiri precizan takson de la malĝusta afero; Ili povas esti ĝuste malĝusta (McFarland and McFarland 2015) . La dua ĉefa leciono de la fiasko de Literaturaj Digestoj estas, ke esploristoj devas rimarki kiel ilia specimeno estis kolektita al la horo. Alivorte, ĉar la procezo de muestreo en la enketo de Literaturaj Digestoj estis sisteme riproĉita al iuj enketitaj, esploristoj bezonis pli kompleksan taksadon, kiu pezis iujn enketitajn ol aliaj. Poste en ĉi tiu ĉapitro, mi montros al vi unu tian pezan proceduron-post-stratifikon - kiu povas ebligi vin fari pli bonajn taksojn de specimenoj.