3.3.1 Reprezento

Tiu traduko estis kreitaj de komputilo. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.3.1 Reprezento

Prezento estas pri faranta inferencoj de viaj respondantoj al via celo loĝantaro.

Por kompreni la tipon de eraroj kiuj povas okazi kiam infiriendo de respondantoj al la granda loĝantaro, ni konsideru la Literary Digest pajlo balotenketo kiu klopodis antaŭdiri la rezulton de la 1936 Usona Prezidenta balotado. Kvankam estis pli ol 75 jaroj, tiu debacle ankoraŭ havas gravan lecionon por instrui esploristoj hodiaŭ.

Literatura Digest estis populara ĝenerala intereso revuo, kaj ekde 1920 ili komencis kuri pajlo balotenketoj antaŭdiri la rezultoj de prezidantaj elektoj. Fari tiujn antaŭdiroj ili sendus balotoj al multa homo, kaj tiam simple Tally la balotoj kiuj revenis; Literatura Digesti fiere raportis ke la balotoj ili ricevis estis nek "weighted, alĝustiĝi, nek interpretita." Tiu procedo ĝuste antaŭdiris la gajninton de la elektoj en 1920, 1924, 1928 kaj 1932. en 1936, en la mezo de la Granda Depresio, Literary Digest elsendis biletojn por 10 milionoj homoj, kies nomoj predominate venis de telefonaj dosierujoj kaj aŭto registriĝo rekordojn. Jen kiel ili priskribis iliajn metodiko:

"LA digesti la glata kurado maŝino movojn kun la rapida precizeco de tridek jaroj 'sperto redukti divenprovado forte faktojn. . . .This Semajno 500 plumoj gratita pli ol kvarono de miliono adresoj tage. Cxiutage en granda ĉambro super motoro-ribboned Kvara Avenuo, en Novjorko, 400 laboristoj lerte gliti miliono pecojn de presita ordinara sufiĉe pavimi kvardek urberojn-en la adresita chirkaùvolvas [sic]. Ĉiuhore, en LA Digest'S propra Poŝtejo Substation, tri babiladon afranko Mezurila maŝinoj sigelita kaj disbatis la blanka oblongs; kvalifikitaj bildkartoj oficistoj spegulita ilin en pandas mailsacks; floto Digest kamionoj rapidis ilin esprimi poŝto-trajnoj. . . Sekva semajno, la unua respondoj de tiuj dek milionoj komencos la venontan tajdon de markita balotoj, esti triobla-kontrolita, kontrolis, kvin-tempoj transversa klasifikitaj kaj nombris. Kiam la lasta cifero estis totted kaj kontrolita, se pasintaj spertoj estas kriterio, la lando scios ene de frakcio de 1 procento la aktuala populara voĉdono de kvardek milionoj [balotantoj]. "(Aŭgusto 22, 1936)

La Digest la fetishization de grandeco estas tuj rekonebla al iu "granda datumo" esploristo hodiaŭ. De la 10 milionoj balotoj distribuita, mirindan 2.4 milionoj balotoj estis resenditaj-tio malglate 1,000 fojojn pli grandaj ol la moderna politika balotenketoj. El tiuj 2,4 milionoj respondantoj la verdikto estis klara: Literatura Digesti antaŭdiris ke la kontestanto Alf Landon tuj venki la oficanto Franklin Roosevelt. Sed, fakte, la malo okazis. Roosevelt venkis Landon en terglito. Kiel povus Literatura Digesti iri malbone kun tiom da datumoj? Nia moderna kompreno de muestreo faras Literatura Digesti la eraroj klara kaj helpas nin eviti fari similajn erarojn en la estonteco.

Pensante klare pri specimenanta postulas nin konsideri kvar malsamaj grupoj de personoj (Figuro 3.1). La unua grupo de personoj estas la celo loĝantaro; tiu estas la grupo kiu la esploro difinas kiel la loĝantaro de intereso. En la kazo de Literatura Digesti la celo loĝantaro estis balotantoj en la 1936 Prezidanta Elekto. Post decidi sur celo loĝantaro, esploristo sekva bezonas evoluigi liston de homoj kiuj povas esti uzitaj por muestreo. Tiu listo estas nomita muestreo kadro kaj la loĝantaro sur la muestreo kadro nomiĝas kadro loĝantaro. En la kazo de Literatura Digesti la kadro loĝantaro estis la 10 milionoj personoj kies nomoj aperis predominate de telefonaj dosierujoj kaj aŭto registriĝo rekordojn. Ideale la celo loĝantaro kaj la kadro loĝantaro estus ekzakte la sama, sed en praktiko tio estas ofte ne la kazo. Diferencoj inter la objektiva loĝantaro kaj kadro loĝantaro nomas kovrado eraro. Priraportadon eraro ne, por oni garantias problemojn. Sed, se la homoj en la kadro loĝantaro estas sisteme malsama popolo ne en la kadro loĝantaro estos kovrado emo. Priraportadon eraro estis la unua el la gravaj difektojn kun la Literary Digest balotenketo. Ili volis lerni pri balotantoj-tio estis ilia celo loĝantaro-sed ili konstruis specimenanta kadro predominate de telefonaj dosierujoj kaj aŭto registroj, fontoj ke super-reprezentitaj riĉaj usonanoj kiuj estis pli verŝajna por subteni Alf Landon (revokon ke ambaŭ de tiuj teknologioj, kio estas komuna nuntempe, estis relative novaj tiutempe kaj ke Usono estis en la mezo de la Granda Depresio).

Figuro 3.1: Reprezento eraroj.

Post difinanta la kadro loĝantaro, la sekva paŝo estas por esploristo elekti la specimeno loĝantaro; Jen estas la popolo, ke la esploristo provos intervjui. Se la specimeno havas malsamajn karakterizaĵojn ol la kadro loĝantaro, tiam ni povas enkonduki muestreo eraro. Tio estas la speco de eraro kalkulita en la rando de eraro kiu kutimas akompani taksoj. En la kazo de la Literary Digest fiasko, ekzistas reale neniu specimeno; ili provis kontakti ĉiuj en la kadro loĝantaro. Kvankam ekzistis neniu eraro de muestreo, estis evidente ankoraŭ eraro. Tio klarigas ke la randoj de eraroj kiuj estas tipe raportitaj kun taksoj de enketoj estas kutime misleadingly malgranda; Ili ne inkludas ĉiuj fontoj de eraro.

Fine, esploristo provas intervjui ĉiuj en la specimeno loĝantaro. Tiuj personoj kiuj sukcese intervjuis nomas respondantoj. Ideale, la specimena loĝantaro kaj la enketitaj estus ekzakte la sama, sed en praktiko ekzistas ne- respondo. Tio estas, homoj kiuj estas selektitaj en la specimeno rifuzas partopreni. Se la personoj kiuj respondas estas malsamaj de tiuj kiuj ne respondas, tiam tie povas esti ne-respondo emo. Ne-respondo emo estis la dua ĉefa problemo kun la Literary Digest balotenketo. Nur 24% de la personoj kiuj ricevis baloto respondis, kaj tio rezultis ke personoj kiuj apogis Landon estis pli verŝajna respondi.

Preter ĵus esti ekzemplo por enkonduki la ideojn de reprezento, la Literary Digest balotenketo estas oft-ripetita parabolon, cautioning esploristoj pri la danĝeroj de hazarda specimenigo. Bedaŭrinde, mi kredas ke la leciono ke multaj homoj ĉerpi el tiu rakonto estas la malĝusta unu. La plej ofta moralo de la rakonto estas ke esploristoj povas ne lerni ion pro ne-probablo specimenoj (te specimenoj sen strikta probablo-bazitaj reguloj por elektanta partoprenantoj). Sed, kiel mi montros poste en tiu ĉapitro, tio ne tute pravas. Anstataŭe, mi kredas ke estas vere du moralaĵoj por tiu rakonto; moralaĵoj kiuj estas tiel vera hodiaŭ kiel ili estis en 1936. Unue, granda kvanto de hazarde kolektita datumon ne garantios bonan takson. Dua, esploristoj devas klarigi kiom ilia datumoj estis kolektitaj kiam ili faras taksoj de ĝi. Alivorte, ĉar la datumoj kolekto procezo en la Literary Digest balotenketo estis sisteme skewed al iuj respondantoj, esploristoj devas uzi pli kompleksan taksado procezo kiu pezoj iuj respondintoj pli ol aliaj. Poste en ĉi tiu ĉapitro, mi montros al vi unu tia ponderación proceduro-post-tavoliĝo-kiu povas ebligi vin fari pli bonajn taksojn kun ne-probablo specimenoj.