3.3.1 Pawakilan

Ngagambarkeun ngeunaan nyieun kasimpulan ti responden Anjeun ka populasi target Anjeun.

Dina raraga ngarti jenis kasalahan anu bisa lumangsung lamun inferring ti responden ka populasi gede, hayu urang mertimbangkeun Literary Digest jarami polling nu usaha prediksi hasil tina pamilihan US Présidén 1936. Sanajan ieu leuwih ti 75 taun ka tukang, debacle ieu masih boga palajaran penting pikeun ngajarkeun panalungtik ayeuna.

Literary Digest ieu majalah umum-interest populér, sarta dimimitian dina 1920 maranehna mimiti ngajalankeun jajal jarami keur prediksi hasil tina Pamilu Présidén. Pikeun nyieun prediksi ieu bakal ngirim ballots ka kavling jalma, terus saukur tally nepi ballots nya éta balik; Literary Digest proudly dilaporkeun yén ballots maranehna ditarima anu ngayakeun "weighted, disaluyukeun, atawa diinterpretasi." Prosedur ieu bener diprediksi juara tina pamilu taun 1920, 1924, 1928 jeung 1932. dina 1936, di satengahing tina Great depresi, Literary Digest dikirim kaluar ballots nepi ka 10 juta urang, nu ngaran predominately datang ti directories telepon jeung rékor ngadaptar mobil. Di dieu nu kumaha maranéhanana digambarkeun metodologi maranéhanana:

"THE nyerna sacara lemes-ngajalankeun mesin belah jeung precision Swift pangalaman tilu puluh taun 'pikeun ngurangan guesswork ka fakta teuas. . . .This Minggu 500 pens scratched kaluar leuwih ti saparapat tina juta Alamat sapoé. Saban poé, di hiji kamar gede luhur di luhur motor-ribboned Kaopat Avenue, di New York, 400 pagawe deftly geser sajuta potongan dicitak zat-cukup rarata opat puluh kota blok-kana envelops kajawab [sic]. Unggal jam, dina THE nyerna'S sorangan Kantor Pos gardu induk, tilu chattering mesin parangko Pangukuran disegel jeung dicap nu oblongs bodas; pagawé pos terampil dibalikkeun kana bodong mailsacks; truk armada nyerna melesat eta pikeun nganyatakeun mail-kareta. . . Minggu hareup, jawaban mimiti ti ieu sapuluh juta baris dimimitian dina pasang asup tina ballots dicirian, jadi triple-dipariksa, diverifikasi, lima-kali cross-digolongkeun jeung totaled. Lamun inohong pamungkas geus totted jeung dipariksa, lamun pangalaman baheula téh kriteria hiji, nagara bakal nyaho dina hiji fraksi 1 persén sora populér sabenerna opat puluh juta [pamilih]. "(Agustus 22, 1936)

fetishization The Digest ngeunaan ukuran anu instan recognizable ka panalungtik "data gedé" ayeuna. Tina 10 juta ballots sebaran, hiji endah pisan 2.4 juta ballots anu balik-éta kasarna 1.000 kali leuwih badag batan jajal pulitik modern. Ti ieu 2.4 juta responden putusan ieu jelas: Literary Digest diprediksi yen nangtang Alf Landon ieu bade ngelehkeun incumbent Franklin Roosevelt. Tapi, dina kanyataanana, sabalikna pasti kajadian. Roosevelt ngéléhkeun Landon dina taneuh urug a. Kumaha bisa Literary Digest indit salah jeung data jadi loba? Pamahaman modern urang sampling ngajadikeun kasalahan Literary Digest sacara jelas tur mantuan urang nyingkahan nyieun kasalahan jiga di mangsa nu bakal datang.

Pamikiran jelas ngeunaan sampling merlukeun urang mertimbangkeun opat golongan nu beda-beda jelema (Gambar 3.1). Golongan kahiji jalma anu populasi target; ieu grup nu panalungtikan ngahartikeun minangka populasi dipikaresep. Dina kasus Literary Digest populasi target ieu pamilih dina Pemilu Présidén nu 1936. Sanggeus mutuskeun dina populasi target, panalungtik a saterusna perlu ngamekarkeun daptar jelema anu bisa dipaké pikeun sampling. Daptar ieu disebut pigura sampling jeung populasi dina pigura sampling disebut populasi pigura. Dina kasus Literary Digest populasi pigura ieu 10 juta urang nu ngaran datang predominately ti directories telepon jeung rékor ngadaptar mobil. Ideally populasi target jeung populasi pigura bakal persis sarua, tapi dina prakna ieu mindeng teu kasus nu bener. Bedana antara populasi target jeung populasi pigura disebut kasalahan sinyalna. kasalahan sinyalna teu, ku sorangan ngajamin masalah. Tapi, lamun urang dina populasi pigura nu sistematis béda ti jelema teu populasi pigura baris aya sinyalna bias. Kasalahan sinyalna ieu kahiji flaws utama jeung polling Literary Digest. Maranéhanana hayang diajar ngeunaan pamilih-nu ieu maranéhanana target populasi-tapi diwangun pigura sampling predominately ti directories telepon jeung registries mobil, sumber nu leuwih-digambarkeun wealthier Amerika anu éta leuwih gampang pikeun ngarojong Alf Landon (ngelingan kadua téknologi ieu, nu ilahar ayeuna, éta kawilang anyar wanoh jeung nu US di satengahing tina Great depresi).

Angka 3.1: kasalahan Pawakilan.

Angka 3.1: kasalahan Pawakilan.

Sanggeus watesan populasi pigura, lengkah saterusna nyaéta pikeun panalungtik pikeun milih populasi sampel; ieu jelema anu panalungtik bakal nyobian wawancara. Lamun sampel ngabogaan ciri beda ti populasi pigura, mangka urang bisa ngawanohkeun kasalahan sampling. Ieu jenis kasalahan etang di margin kasalahan nu biasana accompanies perkiraan. Dina kasus nu fiasco Literary Digest, aya sabenerna ieu no sample; maranehna nyoba kontak dulur di populasi pigura. Sanajan aya no kasalahan sampling, aya écés masih error. Ieu clarifies nu margins kasalahan anu ilaharna dilaporkeun jeung perkiraan tina survey biasana misleadingly leutik; maranehna teu kaasup sagala sumber kasalahan.

Ahirna, panalungtik a nyoba wawancara dulur di populasi sampel. Maranéhanana jalma anu junun diwawancara disebut responden. Ideally, populasi sampel jeung responden bakal persis sarua, tapi dina prakna aya non-response. Hartina, jalma anu dipilih dina sampel nolak pikeun ilubiung. Lamun jalma nu ngabales beda ti jalma anu teu ngabales, mangka aya bisa non-response bias. Non-response bias ieu masalah utama kadua jeung polling Literary Digest. Ngan 24% tina jalma nu narima kartu keur mere sora a direspon, sarta tétéla yén jelema anu dirojong Landon éta leuwih gampang ngabales.

Leuwih ngan keur conto pikeun ngawanohkeun ide tina ngagambarkeun, polling Literary Digest mangrupakeun pasemon oft-terusan, cautioning panalungtik ngeunaan bahaya sampling haphazard. Hanjakalna, Jigana nu palajaran anu loba jelema ngagambar ti carita ieu nyaeta salah salah. moral nu paling umum carita nyaeta panalungtik teu bisa diajar nanaon ti sampel non-probability (ie, sampel tanpa aturan basis probability ketat pikeun milih pamilon). Tapi, salaku Abdi gé mintonkeun saterusna dina bagean ieu, éta teu cukup katuhu. Gantina, Jigana aya bener dua moral carita ieu; moral anu jadi bener ayeuna sabab éta dina 1936. Kahiji, loba data haphazardly dikumpulkeun moal ngajamin a estimasi alus. Kadua, panalungtik kudu akun for kumaha data maranéhanana ieu dikumpulkeun basa aranjeunna keur nyieun estimasi ti dinya. Dina basa sejen, sabab prosés koleksi data dina polling Literary Digest ieu sistematis skewed arah sababaraha responden, panalungtik kudu maké prosés estimasi leuwih kompleks nu beurat sababaraha responden leuwih ti batur. Saterusna dina ieu bab, Abdi gé mintonkeun Anjeun hiji weighting saperti prosedur-pos-stratifikasi-anu bisa ngaktifkeun Anjeun pikeun nyieun perkiraan hade jeung sampel non-probability.